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€^ iWATERIEL NUCLEIQUE RETROVIRAL ET FRAGMENTS NUCLEOTIDIQUES NOTAIWIWENT ASSOCIES A LA 
SCLEROSE EN PLAQUES ET/OU LA POLYARTHRITE RHUiyiATOIDE, A DES FINS DE DIAGNOSTIC, 
PROPHYLACTIQUES ET THERAPEUTiQUES. 



^ Materiel nucl^ique, a I'etat isol6 ou purifi6, et fragment 
nucleotidique, comprenant une sequence nucleotidlque 
choisie dans le groupe qui consiste en (i) les sequences 
SEQ ID NO: 112, SEQ ID NO: 1 14, SEQ ID NO: 117, SEQ 
ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 130. SEQ ID 
NO: 141 etSEQIDNO: 142; (ii) les sequences complemen- 
taires des sequences (i); et (Hi) les sequences equivalentes 
aux sequences (i) ou (ii), en particutier les sequences pre- 
sentant pour toute suite de 100 monomferes contlgus, au 
moins 50 %, et pr6f6rentiellement au moins 70 % d'homolo- 
gie avec respectivement les sequences (i) ou (ii), et utilisa- 
tions pour detecter un retrovirus associe a la sclerose en 
plaques et/ou a la polyarthrite rhumatoide. 
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La Sclerose en Plaques (sep\ «o^. 

demyfilinisante du system, n ""^ "^'^^^^ 

au systeme nerveux central (SNo h««^ , 

cause comnldte y«»c<.^ li'KC) dont la 
^umpxeze reste encore inconnue. 

De nombreux travaux ont ^tav^ 

5 etiologie virale i , ^ I'hypothese d'une 

y e viraie de la inaladie, mais aucun h«= • 

connus testes „e s'est av^r. atre T 

recherche : une revue d.. ^^^"^ ^'^"^^l 

Johnson. ^- No-^rty et r.t. 

'0 RSoemnent, un retrovirus, diffferent d»= • 

hraalns connus a «t6 Isol* ' "^^^ retrovirus 

SEP. Les auteurs o„t "^"""^^^ "'^^""^^ 

pouvalt .tre translls """'"'^ '"^ ^"-'1^- 

15 reconnaitre Is " ' 1 ° """"'"^ -soeptl.ies de 
-ii-ire aes proteines associees a i a. ■ 

«Uules lepto„.„i„,,es par =e retrovirus !" 

I-expression de oe dernier pouvait .trHoIt . 

P^^ ,.„es i-aUts-prJoces^ertar^^^^^^^^ 

" u dr :::nr:„Tt^""^"^"~----- 
.y.nt une activi:; Zn^^Z"^' ■'~ °" ^^^^ 

a.activit. -RT de type ^l. ' 
35 a'obtenir'dlu.'IZr « °"t per„i. 

.es -o.t:^\u\\r:r:~^^^^^^^ - 

atteints de SEP. par un proc4d. de culture te' ""^^ 
Oans le document wo-a-,3 20,3, ^ 
Incorpor* par rSfSrenoe 4 - T 

30 deux U,„.es d.riv.es de llnZT': 

hu^ins, d.no»*es LM,PC at m T . P/--=''-<>«aes 
I'E c A P ^ <16pos4es i 

1 E.C.A.C.C. respective„ent le 22 Juillet 1992 et le 8 
Janvier 1993 sone i«„ , •'^^ ^ 

^« X numeros 92 072201 et 93 010817 

conforrafiment aux disDosii-irsr,o ^ . Oi08l7, 

35 ailleurs les il.'^ Budapest. Par 

type 1^7' oi! ' ? ""^ ^^^-i^^ «T 

type 1^7 ont egale^ent .t. d^pos.s a l.E.c.A.C.C. sous la 
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denomination gXobale de "Eouohes... La "souohe- ou Isolat 
Mberg* par la li,„*e PLl-2, denon»6e POL-2, a d«pos4« 
aupre. de l.E.C.A.C.C. le 2. Juillet 1992 sous le 
n. v«072202. u "souche" ou Isolat h.berg. par la Ugn.e 
5 «7PC, d«„o..4e MS7PG, a «4 d4pos6e aupres 
I'E.C.A.C.C. le 8 janvier 1993 sous le n- V93010816 

car.c.- 1-lats prtcitSs, 

caracterisfes par des critires biologlques et 
morphologic^es, on s-est ensulte attache J caraotiriser le 
10 naterxel nuclWgue assocl. aux partioules vlrales 
produites dans ces cultures. 

Les portions de genome deja caracterisees ont 6t6 
utxlxsees pour ^ettre au point des tests de detection 
moleculaxre du g.„o.e viral et des tests 
15 xmmunoserologiques, utilisant les sequences d-aminoacides 
codees par les sequences nucleotidiques du genome viral 
pour detecter la reponse immunltaire dirig^e centre des 
epitopes associ^s ^ 1- infection et/ou I'expression virale 
ces outils ont deja pe«„is de confimer une 
20 assocxatxon entre la SEP et ^expression des sequences 
identxfxees dans les brevets cites plus loin. Cependant, 
le systeme viral d.couvert par la Den,anderesse, 
s apparente a „n systSme retroviral contplexe. En effet 
les sequences retrouv^es encapsid^es dans les particules 
25 vxrales extracellulaires produites par les diffgrentes 
cultures de cellules de patients atteints de SEP, montrent 
claxre„,ent qu'il y a co-encapsidation de gdnon.es 
retrovxraux apparentds, mais diff^rents du genome 
retroviral "sauvage" qui produit les particules virales 
30 xnfectantes. ce ph6noin6ne a M observe entre des 
retrovirus replicatifs et des retrovirus endog^nes 
appartenant S la men,e fan,ille, voire meme heterologues. La 
notxon de retrovirus endogene est trSs importante dans le 
contexte de notre decouverte car, dans le cas de MSRV-1 
35 on a observe que des sequences retrovirales^ endog^nes 
comprenant des sequences homologues au genome MSRV-l 
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existent dans I'ADN humain normal. L' existence d' elements 
r^troviraux endogenes (ERV) apparent6s i MSRV-i par tout 
ou partie de leur g6nome, explique le fait que 
1' expression du retrovirus MSRV-l dans les cellules 
5 humaines puisse interagir avec des sequences endogenes 
proches. ces interactions sont retrouvees dans le cas de 
retrovirus endogenes pathogenes et/ou infectieux (par 
exemple certaines souches ecotropes du Murine Leukaemia 
virus) , dans le cas de retrovirus exogfenes dont la 
10 sequence nucleotidique peut etre retrouvfee partiellement 
ou en totality, sous forme d'ERVs, dans le genome de 
1' animal hote (ex. virus exogene de la tumeur roammaire de 
la souris transmis par le lait) . Ces interactions 
consistent principalement en (i) une transactivation ou 
15 co-activation d'ERVs par le retrovirus r^plicatif, (ii) 
une encapsidation "illegitime" d'ARN apparentes d'ERVS, ou 
d'ERVs -voire d'ARN cellulaires- possgdant s implement des 
sequences d' encapsidation compatibles, dans les particules 
retrovirales produites par 1' expression de la souche 
20 rfeplicative, parfois transmissibles et parfois avec une 
pathogenicite propre, et (iii) des recombinaisons plus ou 
moins importantes entre les g6nomes co-encapsides , 
notamraent dans les phases de transcription inverse, qui 
conduisent a la formation de genomes hybrides, parfois 
25 transmissibles et parfois avec une pathogenicity propre. 

Ainsi, (i) differentes sequences apparentees 3 
MSRV-l ont ete retrouvees dans les particules virales 
purifiees; (li) 1 'analyse moieculaire des differentes 
regions du genome retroviral MSRV-l doit etre faite en 
0 analysant systematiquement les sequences co-encapsidees, 
interferantes et/ou recombinees qui sont generees par 
1' infection et/ou 1 'expression de MSRV-l, de plus, 
certains clones peuvent avoir des parties de sequences 
defectives produites par la replication retrovirale et les 
5 erreurs de matrice et/ou de transcription de la 
transcriptase inverse; (iii) les families de sequences 
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apparent§es S une meme region gfenomique retroyirale sont 
les supports d'une detection diagnostique globale qui peut 
etre optimisSe par 1 ' identification de regions invariables 
parmi les clones exprirnes et par 1 • identification de 
5 trames de lectures responsables de la production de 
polypeptides antigeniques et/ou pathogenes qui peuvent 
n'§tre produits que par une partie, voire un seul, des 
clones exprimgs et dans ces conditions, 1 -analyse 
systematique des clones exprim^s dans une region d'un gene 
10 donn§ permet d'fevaluer la frequence de variation et/ou de 
recombinaison du genome MSRV-l dans cette region et de 
d^finir les sequences optimales pour les applications, 
notanunent diagnostiques; (iv) la pathologie provoqu^e par 
un retrovirus tel que MSRV-l peut etre un effet direct de 
15 son expression et des protiines ou peptides produits de ce 
fait, mais aussi un effet de 1 -activation, de 
I'encapsxdation, de la recombinaison de genomes apparentfes 
ou h§tgrologues et des prot6ines ou peptides produits de 
ces faits ; ainsi ces genomes associ^s a 1' expression de 
20 et/ou 1' infection par MSRV-l sont-ils une partie 
integrante de la pathogenicite potentielle de ce virus et 
done, constituent des supports de detection diagnostique 
et des cibles th6rapeutiques particulidres. De meme, tout 
agent associ§ a, ou, co-facteur de ces interactions 
25 responsables de la pathogenie en cause, tel que MSRV-2 ou 
le facteur gliotoxique d^crit dans la demande de brevet 
publi^e sous le N« fr-2 716 198, peut participer a 
I'elaboration d'une stratigie globale et tr^s efficace de 
diagnostic, de pronostic, de suivi th#rapeutique et/ou de 
0 th§rapeutique integree de la SEP notamment, mais aussi de 
toute autre maladie associ6e aux mfimes agents. 

Dans ce contexte, on a fait une decouverte 
parall^le dans une autre maladie autoimmune, la 
polyarthrite rhumatoide (PR), qui a et6 d§crite dans la 
5 demande de brevet fran9ais depos^e sous le N»95 02960. 
Cette d§couverte montre que, en appliquant des approches 



2765588 



methodologiques siinilaires a celles qui furent utilis6es 
dans les travaux de la Demanderesse sur la SEP, on a pu 
identifier un retrovirus expriin§ dans la PR qui partage 
les sfequences decrites pour MSRV-1 dans la SEP et aussi, 
5 la co-existence d'une sequence associfie MSRV-2 egalement 
d^crite dans la SEP. En ce qui concerne MSRV-l, les 
sequences d§tectees coromuneinent dans la SEP et la PR, 
concernent les gines pol et gag. En I'itat actuel des 
connaissances, on peut associer les sequences gag et pol 
10 decrites aux souches MSRV-i exprimges dans ces deux 
maladies. 

La pr^sente demande de brevet a pour objet 
diff brents resultats, supplementaires par rapport a ceux 
d6ja proteges par les demandes de brevet fran^ais : 
15 - N» 92 04322 du 03.04.1992, publiee sous le N« 2 689 519; 

- N«» 92 13447 du 03.11.1992, publiee sous le N« 2 689 521; 

- N» 92 13443 du 03.11.1992, publiee sous le 2 689 520; 

- N" 94 01529 du 04.02.1994, publifee sous le N<» 2 715 936; 

- N" 94 01531 du 04.02.1994, publiee sous le 2 715 939; 

- N» 94 01530 du 04.02.1994, publi6e SOUS le 2 715 936; 

- N» 94 01532 du 04,02.1994, publiee sous le N" 2 715 937; 

- N" 94 14322 du 24.11.1994, publiSe sous le N' 2 727 428; 

- N» 94 15810 du 23.12.1994, publiee sous le N» 2 728 585; 
et 

iS - la demande de brevet WO-97/06260. 

La presente invention concerne tout d'abord un 
matferiel nucl^ique, qui peut consister en un materiel 
retroviral, a I'etat isole ou purifie, pouvant €tre 
appr6hend§ ou caract6ris6 de diffferentes manidres : 

~ il coroprend une sequence nucleotidique choisie 
dans le groupe qui consiste en (i) les sequences 
SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117, 

SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 130, 

SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii) les sequences 

5 compl6mentaires aux sequences (i) ; et (ili) les sequences 
fiqpiivalentes aux sequences (i) ou (ii), en particulier les 
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sequences presentant pour toute suite de lOO monomdres 
contigus, au noins 50 %, et pref 6rentieUen«ent au moins 
70 % d'homologie avec respectivement les sequences (i) ou 
(ii); 

5 - il code pour un polypeptide presentant, pour 

toute suite contigue d'au moins 30 acides amines, au moins 
50 %, et de preference au moins 70 % d'homologie, avec une 
sequence peptidique choisie dans le groupe qui consiste en 
SEQ ID NO: 113, SEQ ID N«115, SEQ ID NO: 118, 

10 SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137,- 

- son gene pol coraprend une sequence nucl6otidique 
identique ou gqulvalente a une sequence choisie dans le 
groupe qui consiste en SEQ ID NO: 112, SEQ ID NO: 124 et 
leurs sequences complgmentaires; 

~ I'extremite 5" de son gene pol commence au 
nucleotide 1419 de SEQ ID NO: 130; 

- son gSne pol code pour un polypeptide 
presentant, pour toute suite contigue d'au moins 30 acides 
aminfes, au moins 50 %, et de preference au moins 70 % 

20 d'homologie, avec la sequence peptidique SEQ ID NO: 113; 

- I'extrgmite 3« de son gene gag finit au 
nucleotide 1418 de SEQ id NO: 130; 

- son gfene env comprend une sequence nuclfiotidique 
identique ou 4quivalente li une sequence choisie dans le 

25 groupe qui consiste en SEQ ID NO: 117, et ses sequences 
compl Omenta ires ; 

- son gfene env comprend une sequence nucleotidique 
qui commence au nucleotide 1 de SEQ ID NO: 117 et finit au 
nucleotide au nucleotide 233 de SEQ ID NO: 114; 

~ gene env code pour un polypeptide 

presentant, pour toute suite contigue d'au moins 30 acides 
amines, au moins 50 %, et de preference au moins 70 % 
d'homologie, avec la sequence SEQ ID NO: "118; 

- la region U3R de son LTR 3' comprend une 
35 sequence nucleotidique qui se termine au nucleotide 617 de 

SEQ ID NO: 114; 
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- la rfegion RU5 de son LTR 5' comprend une 
sequence nucl^otidique qui commence au nucleotide 755 de 
SEQ ID NO: 120 et finit au nucleotide 337 de 
SEQ ID NO: 141 ou SEQ ID NO: 142; 

5 - un materiel nucleique retroviral comprenant une 

sequence qui commence au nucleotide 755 de SEQ ID NO: 120 
et qui se termine au nucleotide 617 de SEQ ID NO: 114; 

- le materiel nucleique retroviral tel que dfefini 
pr6c§deminent est en particulier associg a au moins une 

10 maladie auto-immune telle que la sclerose en plaques ou la 
polyarthrite rhumatoide. 

L' invention concerne aussi un fragment 
nucleotidique qui repond au moins a I'une des definitions 
suivantes : 

- il comprend ou consiste en une sequence 
nucleotidique choisie dans le groupe qui consiste en (i) 
les sequences SEQ ID NO: 112, SEQ ID NO: 114, 

SEQ ID NO: 117, SEQ ID NO: 120, SEQ ID NO: 124,' 

SEQ ID NO: 130, SEQ ID NO: 141 et SEQ ID NO: 142 ; (li) 
20 les sequences complementaires des sequences (i) ; et (iii) 
les sequences equivalentes aux sequences (i) ou (ii) , en 
particulier les sequences presentant pour toute suite de 
100 monomeres contigus, au moins 50 %, et 
pr6f6rentiellement au moins 70 % d'homologie avec 
25 respectivement les sequences (i) ou (ii); 

- il comprend ou consiste en une sequence 
nucleotidique codant pour un polypeptide presentant, pour 
toute suite contigue d'au moins 30 acides amines, au moins 
50 %, et de preference au moins 70 % d'homologie, avec une 
30 sequence peptidique choisie dans le groupe qui consiste en 
SEQ ID NO: 113, SEQ ID N«115, SEQ ID NO: 118, 

SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

D'autres objets de la presente invention sont les 
suivants : 

" sonde nucleique pour la detection d'un 

retrovirus associe a la sclerose en plaques et/ou la 
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polyarthrite rhumatoide, susceptiijle de s'hybrider 
specif iquement sur tout fragment pr6c6deminent dgfini et 
appartenant au genome dudit retrovirus; elle possede 
avantageusement de 10 a 100 nucleotides, de preference de 
5 10 S 30 nucleotides; 

- une amorce pour 1 'amplification par 
polymerisation d'un ARN ou d'un ADN d'un retrovirus 
associe a la sclerose en plaques et/ou la polyarthrite 
rhumatoide, qui comprend une sequence nuclSotidique 
10 identique ou Squivalente & au moins une partie de la 
sequence nuclgotidique d'un fragment defini pr§cedemment, 
notamment une sequence nucleotidique pr§sentant pour toute 
suite de 10 monomferes contigus, au moins 50 %, de 
preference au moins 70 % d'homologie avec au moins ladite 
15 partie dudit fragment ; de preference la sequence 
nucleotidique d'une amorce de 1' invention est choisie 
parmi SEQ ID NO: 116, SEQ ID NO: 119, SEQ ID NO: 122, 
SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, 

SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 132, et 
20 SEQ ID NO: 133; 

- un ARN ou ADN, et notamment vecteur de 
replication et/ou d 'expression, comprenant un fragment 
genomique du materiel nucieique ou un fragment dfifini 
precedemment ; 

- un peptide code par tout cadre de lecture ouvert 
appartenant a un fragment nucleotidique defini 
precedemment, notamment un polypeptide, par exemple 
oligopeptide formant ou comprenant un determinant 
antigenique reconnu par des sera de patients infectes par 
le virus MSRV-l, et/ou chez lesquels le virus MSRV-1 a ete 
reactive; un peptide preferentiel comprend une sequence 
identique, partiellement ou totalement, ou equivalente a 
une sequence choisie parmi SEQ ID NO: 113, SEQ ID N'llS, 
SEQ ID NO: 118, SEQ ID NO: 121, SEQ ID NO: 135 et 

35 SEQ ID NO: 137; 



25 
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- une composition diagnostique , prophylactique, ou 
therapeut ique , notaminent pour inhiber 1 • expression d • au 
moins un retrovirus associ§ a la sclerose en plaques et/ou 
a la polyarthrite rhumatoide, comprenant un fragment 

5 nucleotidique d^fini prec^deiument; 

- un precede pour d^tecter un retrovirus associ6 a 
la sclerose en plaques et/ou a la polyarthrite rhumatolde, 
dans un §chantillon biologique, comprenant les etapes 
consistant a mettre en contact un ARN et/ou un ADN presume 

10 appartenir ou provenant dudit retrovirus, ou leur ARN 
et/ou ADN complementaire, avec une composition comprenant 
un fragment nucleotidique d6fini ci-dessus. 

Avant de detainer !• invention, differents termes 
utilises dans la description et les revendications sont a 

15 present dfefinis : 

- par souche ou isolat, on entend toute fraction 
biologique infectante et/ou pathogene, contenant par 
exemple des virus et/ou des bacteries et/ou des parasites, 
g§n6rant un pouvoir pathogdne et/ou antigenique, h§berg6e 

20 par une culture ou un bote vivant ; a titre d* exemple, une 
souche virale selon la definition pr6c6dente peut contenir 
un agent co-infectant, par exemple un protiste pathogene, 

- le terme "MSRV" utilise dans la pr6sente 
description d6signe tout agent pathogene et/ou infectant, 

25 assocl6 k la SEP, notamment une espgce virale, les souches 
att6nu6es de ladite espece virale, ou les particules 
defectives interf erentes ou contenant des genomes co- 
encapsides ou encore des genomes recombines avec une 
partie du genome MSRV-1, d§riv§es de cette espece, II est 
30 connu que les virus et particulierement les virus 
contenant de I'ARN ont une variability, consecutive 
notamment a des taux relativement eleves de mutation 
spontanee, dont il sera tenu compte ci-apr^s pour d§finir 
la notion d' Equivalence, 

" par virus humain, on entend un virus susceptible 
d'infecter ou d'etre heberg6 par I'fitre humain. 
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- compte tenu de toutes les variations et/ou 
recombinaison nature lies ou induites, pouvant 6tre 
rencontr§es dans la pratique de la pr^sente invention, les 
Ob jets de cette derniere, definis ci-dessus et dans les 

5 revendications, ont eti exprlmfis en comprenant les 
Equivalents ou derives des differents matferiels 
biologiques definis ci-apres, notaitvinent des sgqucnces 
homologues nuclSotidiques ou peptidiques, 

- le variant d'un virus ou d'un agent pathogene 
10 et/ou infectant selon 1' invention, comprend au moins un 

antigene reconnu par au moins un anticorps dirigg contre 
au moins un antigene correspondant dudit virus et/ou dudit 
agent pathogene et/ou infectant, et/ou un genome dont 
toute partie est detect^e par au moins une sonde 
15 d« hybridation, et/ou au moins une amorce d« amplification 
nucleotidique spEcifique dudit virus et/ou agent pathogene 
et/ou infectant, dans des conditions d' hybridation 
d§termin€es bien connues de I'homme de I'art, 

- selon 1' invention, un fragment nucleotidique ou 
20 un oligonucleotide ou un polynucleotide est un 

enchalnement de monomeres, ou un biopolymere, caract6ris6 
par la sequence inforraationnelle des acides nucieiques 
naturels, susceptible de s'hybrider a tout autre fragment 
nucleotidique dans des conditions pr6d6termin6es , 

25 1 'enchalnement pouvant contenir des monom§res de 
structures chimiques diffSrentes et etre obtenu a partir 
d'une molecule d'acide nucieique naturelle et/ou par 
recombinaison genetique et/ou par synthase chimique ; un 
fragment nucleotidique peut etre identique a un fragment 

30 genomique du virus MSRV-i considere par la presente 
invention, notamment un gene de ce dernier, par exemple 
pol ou env dans le cas dudit virus ; 

- ainsi un monomfere peut etre un nucleotide 
naturel d'acide nucieique, dont les elements constitutifs 
35 sont un Sucre, un groupement phosphate et une base azotee; 
dans I'ARN le sucre est le ribose, dans I'ADN le sucre est 
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le d6soxy-2-ribose; selon qu'il s'agit de I'ADN ou I'ARN, 
la base azotSe est choisie parmi 1" adenine, la guanine, 
I'uracile, la cytosine, la thymine; ou le nucleotide peut 
§tre modifig dans I'un au moins des trois elements 
5 constitutifs ; a titre d'exemple, la modification peut 
intervenir au niveau des bases, g§n6rant des bases 
roodififees telles que I'inosine, la m^thyl-s- 
d§soxycytidine, la desoxyuridine, la 

dimethylainino-5-desoxyuridine, la diaroino-2 , 6-purine, la 
10 bromo-5-d6soxyuridine et toute autre base modifi§e 
favorisant 1 'hybridation; au niveau du sucre, la 
modification peut conslster dans le remplacement d'au 
moins un d6soxyribose par un polyamide, et au niveau du 
groupement phosphate, la modification peut consister dans 
15 son remplacement par des esters, notamment choisis parmi 
les esters de diphosphate, d'alkyl et arylphosphonate et 
de phosphorothloate, 

- par "sequence informationnelle" , on entend toute 
suite ordonn§e de monomeres, dont la nature chimique et 

20 I'ordre dans un sens de reference, constituent ou non une 
infonnation fonctionnelle de meme quality que celle des 
acides nucieiques naturels, 

- par hybridation, on entend le processus au cours 
duquel, dans des conditions operatoires approprifies, deux 

25 fragments nucieotidiques, ayant des sequences suffisamment 
complementaires, s'apparient pour former une structure 
complexe, notamment double ou triple, de preference sous 
forme d'helice, 

- une sonde comprend un fragment nucleotidique 
30 synthetise par voie chimique ou obtenu par digestion ou 

coupure enzymatique d'un fragment nucleotidique plus long, 
comprenant au moins six monomeres, avantageusement de 10 a 
100 monomeres, de preference 10 a 30 monomdres, et 
possedant une specif icite d 'hybridation dans des 
5 conditions determinees ; de preference, une sonde 
possedant moins de 10 monomdres n'est pas utilisee seule, 
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mais 1-est en presence d'autres sondes de taille aussi 
courte ou non ; dans certaines conditions particuli4res, 
11 peut etre utile d'utiliser des sondes de taille 
sup^rleure ^ lOO monomeres ; une sonde peut notaiament 4tre 
5 utilisee a des fins de diagnostic et 11 s«agira par 
exemple de sondes de capture et/ou de detection, 

- la sonde de capture peut etre immobilisfee sur un 
support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement, par exemple par covalence ou 

10 adsorption passive, 

- la sonde de detection peut 6tre marquge au moyen 
d'un marqueur choisi notamment parmi les isotopes 
radioactifs, des enzymes notamment choisis parmi la 
peroxydase et la phosphatase alcaline et ceux susceptibles 

15 d'hydrolyser un substrat chromogene, fluorigene ou 
luminescent, des composes chimiques chromophores, des 
composes chromogenes, fluorigdnes ou luminescents, des 
analogues de bases nuclfeotidiques, et la biotine, 

- les sondes utilisees S des fins de diagnostic de 
20 1. invention peuvent 6tre mises en oeuvre dans toutes les 

techniques d'hybridation connues, et notamment les 
techniques dites "DOT-BLOT", "SOUTHERN BLOT", "NORTHERN 
BLOT" qui est une technique identique a la technique 
-SOUTHERN BLOT" mais qui utilise de I'ARN comme cible, la 
25 technique SANDWICH ; avantageusement, on utilise la 
technique SANDWICH dans la prgsente invention, comprenant 
une sonde de capture specifique et/ou une sonde de 
detection specifique, 6tant entendu que la sonde de 
capture et la sonde de detection doivent presenter une 
sequence nucl6otidique au moins partiellement diffgrente, 

- toute sonde selon la present e invention peut 
s'hybrider in vivo ou in vitro sur I'ARN et/ou sur I'ADN, 
pour bloquer les ph6nom6nes de replication, notamment 
traduction et/ou transcription, et/ou pour degrader ledit 
ADN et/ou ARN, 
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- une amorce est une sonde comprenant au moins six 
monomer es, et avantageusement de lo li 30 monomSres, 
poss^dant une specif icite d- hybridation dans des 
conditions deterininees, pour 1 'initiation d'une 
5 polymerisation enzymatique, par exemple dans une technique 
d -amplification telle que la PCR (Polymerase Chain 
Reaction), dans un precede d" elongation, tel que le 
sequen9age, dans une methode de transcription inverse ou 
analogue, 

^° ~ sequences nuclgotidiques ou peptidiques 

sent dites equivalentes ou derivees I'une par rapport a 
1 'autre, ou par rapport a une sequence de reference, si 
fonctionnellement les biopolymeres correspondants peuvent 
jouer sensiblement le meme role, sans etre identiques, 
15 vis-a-vis de 1 'application ou utilisation consideree, ou 
dans la technique dans laquelle elles interviennent ; sont 
notamment equivalentes deux sequences obtenues du fait de 
la variabilite naturelle, notamment mutation spontanee de 
I'espfece a partir de laquelle elles ont &t& identifi^es, 
20 ou induite, ainsi que deux sequences homologues, 
I'homologie etant definie ci-apr6s, 

- par "variability", on entend toute modification, 
spontan6e ou induite d'une sequence, notamment par 
substitution, et/ou insertion, et/ou deletion de 
25 nucleotides et/ou de fragments nucl6otidiques, et/ou 
extension et/ou racourcissement de la sequence & I'une au 
moins des extr6mit6s; une variability non naturelle peut 
r6sulter des techniques de g6nie g^netique utilisSes, par 
exemple du choix des amorces de synthese deg§n6r6es ou 
30 non, retenues pour amplifier un acide nucl6ique; cette 
variability peut se traduire par des modifications de 
toute sequence de depart, consid6ree comme reference, et 
pouvant etre exprimges par un degri d'homologie par 
rapport d ladite sequence de reference, 
5 - I'homologie caracterise le degre d' identity de 

deux fragments nucieotidiques ou peptidiques comparys ; 
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elle se mesure par le pourcentage d'identite qui est 
notamment determine par comparaison directe de sequences 
nucleoditiques ou peptidiques, par rapport a des sequences 
nucl6otidiques ou peptidiques de reference, 

5 - tout fragment nucleotidique est dit Equivalent 

ou d§riv§ d'un fragment de reference, s'il pr6sente une 
sequence nucleotidique equivalente a la sequence du 
fragment de r§f6rence ; selon la definition precSdente, 
sont notamment equivalents a un fragment nucleotidique de 

0 reference : 

(a) tout fragment susceptible de s 'hybrider au 
moins partiellement avec le complement du fragment de 
reference, 

(b) tout fragment dont I'alignement avec le 
fragment de reference conduit a mettre en evidence des 
bases contigues identiques, en nombre plus important 
qu'avec tout autre fragment provenant d'un autre groupe 
taxonomique, 

(c) tout fragment resultant ou pouvant resulter de 
la variabilite naturelle de I'espece, a partir de laquelle 
il est obtenu, 

(d) tout fragment pouvant resulter des techniques 
de ggnie genStique appliquSes au fragment de reference, 

(e) tout fragment, comportant au moins huit 
nucleotides contigus, codant pour un peptide homologue ou 
identique au peptide cod§ par le fragment de reference, 

(f) tout fragment different du fragment de 
reference, par insertion, deletion, substitution d'au 
moins un monomere, extension, ou raccourcissement k l*une 
au moins de ses extremites ; par exemple, tout fragment 
correspondant au fragment de reference, flanque a I'une au 
moins de ses extr6mit6s par une sequence nucleotidique ne 
codant pas pour un polypeptide, 

- par polypeptide, on entend notamment tout 
peptide d'au moins deux acides amines, notamment 
oligopeptide, protfiine, extrait, sSparS, ou 
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substantiel lament isole ou synthetise, par 1 • intervention 
de la main de I'homme, notamment ceux obtenus par synthese 
chimique, ou par expression dans un organisme recombinant, 

" par polypeptide code de raaniere partielle par un 
fragment nucleotidique, on entend un polypeptide 
presentant au moins trois acides amines codSs par au moins 
neuf monomeres contigus compris dans ledit fragment 
nuclfeotidique , 

- un acide amine est dit analogue a un autre acide 
amine, lorsque leur caracteristiques physico-chimiques 
respectives, telles que polarite, hydrophobicite, et/ou 
basicite, et/ou acidity, et/ou neutralite, sont 
sensiblement les memes ; ainsi, une leucine est analogue a 
une isoleucine. 

- tout polypeptide est dit equivalent ou derive 
d'un polypeptide de reference, si les polypeptides 
compares ont sensiblement les memes propriStfes, et 
notainiaent les mSmes proprietes antigeniques, 
immunologiques, enzymologiques et/ou de reconnaissance 
moleculaire ; est notamment equivalent a un polypeptide de 
reference : 

(a) tout polypeptide possedant une sequence dont 
au moins un acide amin6 a ete substitue par un acide amin6 
analogue, 

(b) tout polypeptide ayant une sequence peptidicjue 
6quivalente, obtenue par variation naturelle ou induite 
dudit polypeptide de reference, et/ou du fragment 
nucleotidique codant pour ledit polypeptide, 

(c) un mimotope dudit polypeptide de reference, 

(d) tout polypeptide dans la sequence duquel un ou 
plusieurs acides amines de la serie L sont remplacSs par 
un acide amine de la serie D, et vice versa, 

(e) tout polypeptide dans la sequence duquel on a 
introduit une modification des chaines laterales des 
acides amines, telle que par exemple une ac6tylation des 
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fonctions amines, une carboxylation des fonctions thiol, 
une esterification des fonctions carboxyliques, 

(f) tout polypeptide dans la sequence duquel une 
ou des liaisons peptidiques ont ete modifiees, comroe par 

5 exemple les liaisons carba, retro, inverse, r6tro- inverse, 
reduites, et ni6thylene-oxy, 

(g) tout polypeptide dont au moins un antig^ne est 
reconnu par anticorps dirige contre un polypeptide de 
r6f6rence, 

^° - pourcentage d'identite caracterisant 

I'homologie de deux fragments peptidiques compares est 
selon la presente invention d'au moins 50% et de 
preference au moins 70 %. 

Etant donne qu'un virus possedant une activite 

15 enzymatique transcriptase inverse peut etre genetiquement 
caracterise aussi bien sous forme d'ARN que d'ADN, il sera 
fait mention aussi bien de I'ADN que de I'ARN viral pour 
caracteriser les sequences relatives a un virus possgdant 
une telle activity transcriptase inverse, dit MSRV-l selon 

20 la presente description. 

Les expressions d'ordre utilisees dans la presente 
description et les revendications , telles que "premifere 
sequence nucieotidique" ne sont pas retenues pour exprimer 
un ordre particulier, mais pour definir plus clairement 

25 1 • invention. 

Par detection d'une substance ou agent, on entend 
ci-aprds aussi bien une identification, qu'une 
quantification, ou une separation ou isolement de ladite 
substance ou dud it agent. 

L' invention sera mieux comprise d la lecture de la 
description detail lee qui va suivre faite en reference aux 
figures annexees dans lesquelles : 

La Figure l represente la structure generale de 
I'ADN proviral et I'ARN genomique de MSRV-i. 
15 La Figure 2 represente la sequence nucieotidique 

du clone denomme CL6-5' (SEQ ID NO: 112) et trois trames 
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de lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure 3 repr^sente la sequence nucl6otidique 
du clone d^nomme CL6-3 • (SEQ ID NO: 114) et trois trames 
5 de lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure 4 reprSsente la sequence nucleotidique 
du clone denommS C15 (SEQ ID NO: 117) et trois trames de 
lecture potentielles en acides amines figurant sous la 
10 sequence nuclfeotidique. 

La Figure 5 reprSsente la sequence nucleotidique 
du clone d§nomm§ 5M6 (SEQ ID NO: 120) et trois trames de 
lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure 6 represente la sequence nucleotidique 
du clone d^nomme CL2 (SEQ ID NO: 130) et trois trames de 
lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure 7 represente trois trames de lecture 
potentielles en acides amines exprim^es par pET28C-clone 2 
et figurant sous la sequence nucleotidique. 

La Figure 8 represente trois trames de lecture 
potentielles en acides amines exprimees par pET21C-clone 2 
et figurant sous la sequence nucleotidique. 

^ Figure 9 represente la sequence nucleotidique 
du clone denomme LB13 (SEQ ID NO: 141) et trois trames de 
lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure lo represente la sequence nucleotidique 
30 du clone denomme LAI 5 (SEQ ID NO: 142) et trois trames de 
lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 

La Figure ll represente la sequence nucleotidique 
du clone denomme LB16 (SEQ ID NO: 124) et trois trames de 
35 lecture potentielles en acides amines figurant sous la 
sequence nucleotidique. 
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EXMPLEJ. : OBTENTION D'UNE REGION CL6-5' CODANT POUR 
L'EXTREMITE N-TERMIMALE DE L'INTEGRASE ET D^UNE REGION 
CL6-3' CONTENANT LA SEQUENCE 3- TERMINALE DU GENOME MSRV-1 

5 

Une 3 -RACE a 6t6 effectuee sur de I'ARN total 
extrait de plasma d'un patient atteint de SEP. Un plasma 
temoin sain, traite sous les memes conditions, a M 
utilise coimne contrSle negatif. La synthise de cDNA a 6te 
10 r^alis^e avec une amorce oligo dT identifiee par 
SEQ ID NO: 68 (5- GAC TCG CTG CAG ATC GAT TTT TTT TTT TTT 
TTT T 3') et la transcriptase inverse "ExpandTM rt.* de 
Boehringer selon les conditions preconisees par la 
soci6t6. une PGR a et^ effectuee avec l^enzyme Klentaq 
15 (Clontech) sous les conditions suivantes : 940c 5 min puis 
930c 1 min, 580C 1 min, es-c 3 min pendant 40 cycles et 
68 -C pendant 8 min, avec un volume reactionnel final de 
50 Hi. 

Amorces utilisSes pour la PGR: 
20 - amorce 5', identififie par SEQ id NO: 69 

5 • GCC ATC AAG CCA CCC AAG AAC TCT TAA CTT 3 • ; 
- amorce 3', identifiee par SEQ ID NO: 68 

Une deuxidme pcr dite "semi-nichie" a 6t6 
r6alis6e avec une amorce 5- situ4e a I'int^rieur de la 
region dija amplififee. Cette deuxi^me pcr a ete effectufee 
sous les m§mes conditions exp^rimentales que cellee 
utilis^es lors de la premiere PCR, en utilisant 10 Ml du 
produit d- amplification issu de la premiere PCR. 
Amorces utilisges pour la PCR semi-nichee: 

- amorce 5', identifiee par SEQ ID NO: 70 
5 ' CCA ATA GCC AGA CCA TTA TAT ACA CTA ATT 3 • ; 

- amorce 3', identifiee par SEQ ID NO: 68 

Les amorces SEQ ID NO: 69 et SEQ ID NO: 70 sont 
sp6cifiques de la region pol de MSRV-i. 

Un produit d'amplification de i,9Kb a 6t6 obtenu 
pour le plasma de patient SEP. Le fragment correspondant 
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n'a pas observe pour le plasma temoin sain. Ce produit 
d« amplification a ete clone de la fa9on suivante : 
I'ADN amplifig a 6t6 ins6r6 dans un plasmide a I'aide du 
kit TA Cloning®. Les 2 Ml de solution d'ADN ont #t6 
5 m§lang6s avec 5 m d'eau distlll6e sterile, i/xl d'un 
tampon de ligation lo fois concentre "lOX LIGATION 
BUFFER", 2 Ml de "pCRTM VECTOR" (25 ng/ml) et l ^1 de "14 
DNA LIGASE". Ce melange a ete incube une nuit a 12<>C. Les 
etapes suivantes ont ite realis^es conformenient aux 
10 instructions du kit TA Cloning® (Invitrogen) . A la fin de 
la procedure, les colonies blanches de bact^ries 
recoinbinantes (white) ont ete repiquees pour etre 
cultivees et permettre !• extraction des plasmides 
incorpor^s selon la procedure dite de "rainiprep". La 
preparation de plasmide de chaque colonic recombinante a 
M couple par une enzyme de restriction appropriee et 
analys6e sur gel d« agarose. Les plasmides possfedant un 
insert d#tect6 sous lumiere uv apres marquage du gel au 
bromure d'6thidium, ont et§ s§lectionngs pour le 
20 sfequengage de 1- insert, apres hybridation avec une amorce 
compl6mentaire du promoteur Sp6 present sur le plasmide de 
clonage du TA cloning kit®. La reaction pr6alable au 
s§quen9age a ensuite ete effectuee selon la m^thode 
prfeconisSe pour 1 'utilisation du kit de s6quenpage 
25 "PRISM™ Ready Reaction AmpliTaqo FS, DyeDeoxy™ 
Terminator" (Applied Biosystems, ref. 402119) et le 
s6quen«7age automatique a et§ r6alis§ sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 
fabricant. 

clone obtenu, contient une region CL6-5'codant 
pour 1* extremity N terminale de l'int§grase et une region 
CL6-3', correspondant i la region 3' terminale de MSRV-l 
et permettant de definir la fin de I'enveloppe (234 pb) et 
les regions U3, R (4 01 pb) du retrovirus MSRVl. 
■^^ ^ region correspondant a l'extr6mite N terminale 

de l»int6grase est representee par sa sequence 
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nucl6otidique (SEQ ID NO: 112) dans la figure 1. Les trois 
trames de lecture potent iel les sont pr6sent6es par leur 
sequence aininoacide sous la sequence nucleotidique, et la 
sequence aminoacide de I'extr^mitS N-terninale de 
5 I'intfegrase est identififee par SEQID NO: 113. 

La region C16-3' est representee par sa sequence 
nuclfiotidique (SEQ ID NO: 114) dans la figure 3. Les trois 
trames de lecture potentielles sont presentees par leur 
sequence aininoacide sous la sequence nuclSotidique. Une 
10 sequence aininoacide correspondant a l'extr6init§ 
C-tenninale de la protiine env de MSRV-i est identifiee 
par SEQ ID NO: 115. 

EXEMPLE 2 : DETENTION DU CLONE C15 CONTENANT LA REGION 
15 CODANT POUR UNE PARTIE DE L'ENVELOPPE DU RETROVIRUS MSRV-1 

Une RT-PCR a ete effectuee sur de I'ARN total 
extrait de virions concentres par ultracentrifugation a 
partir d'un surnageant de culture de synoviocytes 
provenant d'un patient PR. La synthese de cDNA a §t6 
realisee avec une amorce oligo dT et la transcriptase 
inverse "ExpandTM rt" de Boehringer selon les conditions 
preconisees par la society. Une PCR a 6te effectuee avec 
1« ExpandTM Long Template PCR System (Boehringer) sous les 
25 conditions suivantes : 94«C 5 inin puis 93«»C 1 min, 60«C 1 
min, 68 -C 3 min pendant 4 0 cycles et 68<»C pendant 8 roin et 
avec un volume reactionnel final de 50 ixl. 
Amorces utilisees pour la PCR: 

- amorce 5', identifiee par SEQ ID NO: 69 

30 5' GCC ATC AAG CCA CCC AAG AAC TCT TAA CTT 3' ; 

- amorce 3', identifiee par SEQ ID NO: 116 

5' TGG GGT TCC ATT TGT AAG ACC ATC TGT AGC TT 3> 

Une deuxieme PCR dite "semi-nich6e" a §t6 
realis6e avec une amorce 5« situee a 1 ' int§rieur de la 
35 region deja amplifiie. Cette deuxieme PCR a et6 effectu6e 
sous les roemes conditions exp6rimentales que celles 
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utilisees lors de la premiere PGR (sauf que 3 0 cycles ont 
ete realises au lieu de 40), en utilisant lo axI du produit 
d» amplification issu de la premiere PGR* 
Amorces utilisees pour la PGR semi-nichee: 
5 - amorce 5«, identififee par SEQ ID NO: 70 

5' CCA ATA GGC AGA CCA TTA TAT ACA CTA ATT 3' ; 
- amorce 3', identififee par SEQ ID NO: 116 

Les amorces SEQ ID NO: 69 et SEQ ID NO: 7 0 sont 
specif iques de la region pol de MSRV-1. L' amorce SEQ ID 
10 NO: 116 est specifique de la sequence FBdl3 (aussi dSnommS 
B13) et est localisee dans la region env conservee parmi 
les oncorStro virus. 

Un produit d 'amplification de 1932 pb a ete 
obtenu et clon6 de la fa^on suivante : 
15 l^ADN amplifie a ete insere dans un plasmide a I'aide du 
kit TA Cloning®* Les differentes etapes ont ete realisees 
conformement aux instructions du kit TA Cloning® 
(Invitrogen) . A la f in de la procedure, les colonies 
blanches de bacteries recombinantes (white) ont 6t6 
20 repiquees pour etre cultivees et permettre 1 'extraction 
des plasmides incorporfes selon la procedure dite de 
"miniprep". La preparation de plasmide de chaque colonic 
recombinante a 6te coupee par une enzyme de restriction 
appropri§e et analys6e sur gel d« agarose. Les plasmides 
25 poss6dant un insert dfetecte sous lumiere UV apres marquage 
du gel au bromure d'ethidium, ont et6 s61ectionn6s pour le 
sSquengage de 1' insert, apres hybridation avec une amorce 
complSmentaire du promoteur SP6 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prealable au 
30 s6quen?age a ensuite et§ effectuee selon la m§thode 
prficonisee pour 1 'utilisation du kit de sequen^age 
"PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 
Terminator" (Applied Biosystems, ref. 4 02119) et le 
sdquen?age automatique a ete realise sur les appareils 
5 373 A et 377 Applied Biosystems, selon les instructions du 
fabricant. 
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Le clone CI 5 obtenu, contient une region 
correspondant a la region de I'enveloppe de MSRV-l, de 
1481 pb. 

La region env du clone C15 est representee par sa 
5 sequence nucliotidique (SEQ ID NO: 117) dans la figure 5. 
Les trois trames de lecture potentielles de ce clone sont 
presentees par leur sequence aminoacide sous la sequence 
nuclfeotidique. La trame de lecture correspondant a une 
proteins env structurale MSRV-i est identifiee par 
10 SEQ ID NO: 118. 
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EXEMPLE 3 : OBTENTIOM D'UN CLONE 5M6 CONTENANT LES 
SEQUENCES DE LA REGION 3' TERMINALS DE L'ENVELOPPE. 
SUIVIES DES SEQUENCES U3,R,U5 DE TYPE PROVIRAL MSRV-1. 

Une PGR Monodirectionnelle a ete effectu6e sur de 
I'ADN extrait de lymphocytes B immortalises en culture 
d'un patient PR. La PCR a §te effectuee avec 1' Expand™ 
Long Template PCR System (Boehringer) sous les conditions 
suivantes : 94«C 3 min puis 93«C 1 min, 60<»C 1 min, 68-C 3 
min pendant 10 cycles , puis 93 -c i min, 60«c i min avec 
15 sec d'extension h chaque cycle, 68-C 3 min pendant 35 
cycles et 68 oc pendant 7 min et avec un volume reactionnel 
final de 50 ^1. 

L« amorce utilis6e pour la PGR identifiee par 
SEQ ID NO: 119 est 5 • TCA AAA TCG AAG AGC TTT AGA CTT OCT 
AAC GG 3' ; 

L'amorces SEQ id NO: 119 est specifique de la region env 
du clone C15. 

Un produit d 'amplification de 1673 pb a ete 
obtenu et clone de la fa<?on suivante : 

I'ADN amplifie a ete insere dans un plasmide a I'aide du 
kit TA Cloning®. Les differentes etapes ont ete realisees 
conformement aux instructions du kit TA Cloning* 
35 (Invitrogen) . A la fin de la procedure, les colonies 
blanches de bacteries recombinantes (white) ont 6t6 
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repiqu6es pour 6tre cultivees et perinettre 1 'extraction 
des plasmides incorpores selon la procedure dite de 
"miniprep". La preparation de plasmide de chaque colonic 
reconibinante a et§ coupee par une enzyme de restriction 
5 approprifee et analys6e sur gel d' agarose. Las plasmides 
; possedant un insert detecte sous lumiere UV apres marquage 
du gel au bromure d'gthidium, ont 6t6 s61ectionnes pour le 
s6quen9age de 1' insert, apres hybridation avec une amorce 
complementaire du promoteur T7 present sur le plasmide de 
10 clonage du TA cloning kit®. La reaction prealable au 
s6quen<?age a ensuite et6 effectu6e selon la mSthode 
preconis6e pour 1 'utilisation du kit de sequenqjage 
"PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 
Terminator" (Applied Biosystems, ref. 402119) et le 
15 sequengage automatique a ete realise sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 
fabricant. 

Le clone 5M6 obtenu, contient une region 
correspondant li la region 3' de I'enveloppe de MSRV-i, de 
20 492 pb suivi des regions U3, R et U5 (837 pb) de MSRVl. 

Le clone 5M6 est represents par sa sequence 
nuclfeotidique (SEQ ID NO: 120) dans la figure 7. Les trois 
trames de lecture potentielles de ce clone sont presentees 
par leur sequence aminoacide sous la sequence 
25 nucieotidique. La traroe de lecture correspondant a 
I'extremite C-terminale de la proteine env MSRV-1 est 
identifiee par SEQ ID NO: 121. 

EXEMPLE 4 : OBTENTION DU CLONE LSI 6 CONTENANT LA REGION 

30 CODANT L'INTEGRASE DU RETROVIRUS MSRV-1 

Une RT-PCR a etg effectuee sur de I'ARN total 
traite a la DNAsel et extrait a partir d'un plexus 
choroide provenant d'un patient SEP. La synthese de cDNA a 
ete realisee avec une amorce oligo dT et la transcriptase 

35 inverse "Expand™ rt" de Boehringer selon les conditions 
preconisees par la societe. Un contrSle "no RT" a ete 
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effectu^ parallfelement sur le meme materiel. Une PCR a 6t6 
effectuee avec la Taq polymerase (Perkin Elmer) sous les 
conditions suivantes : ss^c 5 min puis gs^C 1 min, 55»c 1 
min, 72 »C 2 min pendant 35 cycles et 72 »C pendant 8 min et 
5 avec un volume reactionnel final de 50 jul. 
Amorces uti Usees pour la PCR: 

- amorce 5', identifiie par SEQ ID NO: 122 
5' GGC ATT GAT AGC ACC CAT CAG 3' ; 

- amorce 3', identifi^e par SEQ ID NO: 123 
10 5' CAT GTC ACC AGG GTG GAA TAG 3* 

L' amorce SEQ ID NO: 122 est sp§cifique de la 
region pol de MSRV-l et plus precis6ment similaire a la 
region integrase decrite precedement. L' amorce 
SEQ ID NO 123 a 6tg dSfinie sur des sequences des clones 
15 obtenus lors d'essais prSalables. 

Un produit d ' amplification d' environ 760 pb a ete 
obtenu uniquement dans I'essai avec RT et a 6te clonS de 
la fagon suivante : 

I'ADN amplifig a ete insert dans un plasmide a I'aide du 
20 kit TA Cloning®. Les diff^rentes stapes ont ete realisees 
conformement aux instructions du kit TA Cloning® 
(Invitrogen). A la fin de la procedure, les colonies 
blanches de bacteries recombinantes (white) ont 6t6 
repiqu6es pour §tre cultiv^es et permettre 1« extraction 
25 des plasmides incorpores selon la procedure dite de 
"rainiprep". La preparation de plasmide de chaque colonic 
recombinante a coupSe par une enzyme de restriction 

appropriee et analys6e sur gel d 'agarose. Les plasmides 
poss^dant un insert d6tecte sous lumiere UV aprds marquage 
30 du gel au bromure d'fethidiura, ont 6t6 selectionn^s pour le 
s^quengage de !• insert, apres hybridation avec une amorce 
compl6mentaire du promoteur T7 present sur le plasmide de 
clonage du TA cloning kit®. La reaction prSalable au 
sequengage a ensuite et6 effectu6e selon la m^thode 
35 pr§conis€e pour 1 'utilisation du kit de sfequengage 
"PRISM™ Ready Reaction AmpliTaq® FS, DyeDeoxy™ 
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Terminator" (Applied Biosystems, ref. 402119) et le 
sSquengage automatique a ete realise sur les appareils 
373 A et 377 Applied Biosystems, selon les instructions du 
fabr leant, 

5 Le clone LB16 obtenu, cent lent les sequences 

correspondant S I'integrase. La sequence nucleotidique de 
ce clone est identiflee par SEQ ID NO: 124 sur la figure 
11, trois traroes de lecture sont determinees- 

10 EXEMPLE 5: OBTENTION D'UN CLONE 2, CL2, CONTENANT EN 

3« UNE PARTIE HOMOLOGUE AU GENE POL, CORRESPONDANT AU GENE 
PROTEASE, ET AU GENE GAG (GM3) CORRESPONDANT A LA 
NUCLEOCAPSIDE, ET UNE NOUVELLE REGION 5'CODANTE, 
CORRESPONDANT AU GENE GAG PLUS SPECIF IQUEMENT LA MATRICE 

15 ET LA CAPSIDE de MSRV-l. 

Une amplification par PCR a ete effectuee sur de 
I'ARN total extrait a partir de 100 /xl de plasma d»un 
patient atteint de SEP. Un temoin eau, traits sous les 

20 mfemes conditions, a etS utilise comme contr61e nSgatif. La 
synthese de cDNA a §te realis^e avec 300 pmole d'une 
amorce aleatoire (GIBCO-BRL, France) et la transcriptase 
inverse "Expand RT" (BOEHRINGER MANNHEIM, France) selon 
les conditions pr§conisees par la soci6t6. Une 

25 amplification par PCR (" polymerase chain reaction ") a 
6t6 effectufie avec !• enzyme Tag polymerase (Perkin Elmer, 
France) en utilisant 10 /xl de cDNA sous les conditions 
suivantes: 94«C 2 min, 55*>C 1 min, 72^C 2 min puis 94*»C 
1 min, 55^C 1 min, 72*C 2 min pendant 30 cycles et 72«C 

30 pendant 7 min et avec un volume reactionnel final de 
50 Ml- 

Amorces utilis6es pour 1 « amplification par PCR: 
- amorce 5', identifiee par SEQ ID NO: 126 
5 • CGG ACA TCC AAA GTG ATG GGA AAC G 3 ' ; 
35 - amorce 3«, identifiee par SEQ ID NO: 127 
5' GGA CAG GAA AGT AAG ACT GAG AAG GC 3' 
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Une deuxieme amplification par PCR dite "seini- 
nich6e" a 6te rSalisee avec une amorce 5- situ6e A 
I'intirieur de la region d^ja ainplifige. Cette deuxiime 
PCR a et6 effectu^e sous les memes conditions 
expgrimentales que celles utilis6es lors de la premiere 
PCR, en vitilisant lo ^1 du produit d ■amplification issu de 
la premiere PCR. 

Amorces utilisees pour 1 -amplification par PCR semi- 
nichee: 

- amorce 5', identifiee par SEQ ID NO: 128 
5 ' CCT AGA ACG TAT TCT GGA GAA TTG GG 3 • ; 

- amorce 3', identifiee par SEQ ID NO: 129 
5 ' TGG CTC TCA ATG GTC AAA CAT ACC CG 3 • 

Les amorces SEQ id NO: et SEQ id NO: sont 
15 specif iques de la region pol, clone G+E+A, plus 
sp^cifiquement la region E: position nucleotidique n«» 423 
^ no 448. Les amorces utilisees dans la region 5- ont M 
dgfinies sur des sequences de clones obtenus lors d'essais 
pr6alables. 

^° ^" produit d' amplification de 1511 pb a ete 

obtenu a partir de I'arn extrait du plasma de patient SEP. 
Le fragment correspondant n'a pas M observfe pour le 
tfemoin eau. Ce produit d 'amplification a it# clonfe de la 
fagon suivante. 

25 L'ADN amplifig a ete ins§r6 dans un plasmide & 

I'aide du kit TA CloningTM. Les 2 m1 de solution d'ADN ont 
et6 melanges avec 5 Ml d'eau distillee st6rile, i m d'un 
tampon de ligation lo fois concentre "lOX LIGATION 
BUFFER", 2 Ml de "pCrTM VECTOR" (25 ng/ml) et 1 m1 de "T4 
30 DNA LIGASE". Ce melange a 6t6 lncub4 une nuit a 14 «C. Les 
stapes suivantes ont ete realis^es conform6ment au 
instructions du kit TA Cloning® (Invltrogen) . Le melange a 
et6 6tal6 apr6s transformation de la ligation dans des 
bact6ries E, coli iNVaF'. a la fin de la procedure, les 
35 colonies blanches de bactdries recombinantes ont 6t6 
repiquees pour %tre cultivees et permettre 1 'extraction 
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des plasmides incorpores selon la procedure dite de 
"minipr^paration d'ADN" (17) . La preparation de plasmide 
de chaque colonie recombinants a ete coupee par 1' enzyme 
de restriction Eco RI et analys6e sur gel d- agarose. Les 
plasmides poss^dant un insert detects sous lumiere UV 
apres marquage du gel au bromure d'ithidium, ont 6t6 
s61ectionn6s pour le sgquen<?age de !■ insert, apr^s 
hybridation avec une amorce complementaire du promoteur T7 
prisent sur le plasmide de clonage du TA cloning kit®. La 
reaction prealable au sequengage a ensuite 6t6 effectuge 
selon la methode pr^conisie pour 1 • utilisation du kit de 
s^quen^ag^ "PRISM™ Ready Reaction Amplitaq. fs, 
DyeDeoxy Terminator" (Applied Biosystems, ref. 402119) 
et le s6quen?age automatique a ete realise sur les 
15 appareils 373 A et 377 Applied Biosystems, selon les 
instructions du fabricant. 

Le clone obtenu, d§nomm§ CL2, contlent une region 
C-terminale similaire a la region 5- terminale des clones 
G+E+A de MSRV-l, qui permet de dfefinir la region C- 
20 terminale du ggne gag et une nouvelle rggion 
correspondante a la r€gion N-terminale du g^ne gag MSRV-l. 

CL2 permet de dfifinir une region de I5ii pb 
prfesentant une phase ouverte de lecture dans la region N- 
terminale de 1077 pb codante pour 359 acides amines et une 
phase non-ouverte de lecture, de 454 pb, correspondant a 
la region C-terminale du gdne gag MSRV-l. 

La sequence nucleotidique de CL2 est identififee 
par SEQ ID NO: 130. Elle est representee ^ la figure 
XX3,i, avec les trames de lecture potent iel les en 
0 aminoacide. 

Le fragment de 1077 pb de CL2 codant pour 359 
acides amines a ete amplifie par PCR avec 1 -enzyme iVo 
(5U//il) (Boehringer Mannheim, France) en utilisant 1 m1 de 
la minipreparation de I'ADN du clone 2 sous les conditions 
5 suivantes : 95«C 1 min, 60»C 1 min, 72»C 2 min pendant 25 
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cycles et avec un volume rSactionnel final de 50 (il a 
I'alde des amorces: 

- amorce 5' (Bam HI), identifig par SEQ ID NO: 132 
5- TGC TGG AAT TCG GGA TCC TAG AAC GTA TTC 3 • (30 mer) , et 
5 - amorce 3" (Hind III), identifiS par SEQ ID NO: 133 
5 AGT TCT GCT CCG AAG CTT AGG CAG ACT TTT 3 ' (30 mer) 
correspondant, respect ivement, a la sequence nucleotidique 
du clone 2 en position -9 a 21 et 1066 a 1095. 

Le fragment obtenu apr^s PCR, a 6t& lin§aris6 par 
10 Bam HI et ^indlli et sous-clone dans les vecteurs 
d' expression pET28C et pET21C (NOVAGEN) lin^arisg par Bam 
HI et Hind III. Le s6quen9age de 1«ADN du fragment de 1077 
pb du clone 2 dans les deux vecteurs d« expression a 6te 
realist selon la methode prSconisee pour 1 'utilisation du 
15 kit de sequencjage "PRISM™ Ready Reaction Amplitaq® FS, 
DyeDeoxy Terminator" (Applied Biosysteros, ref. 402119) 
et le s§quen9age automatique a 6te r§alisg sur les 
appareils 373 A et 377 Applied Biosystems, selon les 
instructions du fabricant. 
^° L'expression de la sequence nucleotidique du 

fragment de 1077 pb du clone 2 par les vecteurs 
d'expression pET28C et pET21C sont identifi6es par 
respectivement SEQ ID NO: 135 et SEQ ID NO: 137. 

25 pXEMPLE 6 ; EXPRESSION DU CLONE 2 CHEZ ESCHERICHIA COLI 

Les constructions pET28c-clone 2 (1077 pb) et 
pET21C-clone 2 (1077 pb) synthetisent, dans la souche 
bact6rienne BL21 (DE3), une prot6ine en fusion N- et C- 
terminale pour le vecteur pET28C et C-Terminale pour le 
vecteur pET21C avec 6 Histidines, de masse molfeculaire 
apparente d 'environ 45 kDa, mise en evidence par 
61ectrophor6se sur gel de polyacrylamide SDS-PAGE (SDS « 
Dodecyl Sulfate de Sodium) (Laemmli, 1970 (i)). La 
35 reactivity de la proteine a ete mise en Evidence vis a vis 
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d'un anticorps monoclonal anti-Histidine (DIANOVA) par la 
technique de Western blot (Towbin et al., 1979 (2)). 

Les prot6ines recombinantes pET28c-clone 2 
(1077 pb) et pET21C-clone 2 (1077 pb) ont et# visualisees 
en SDS-PAGE dans la fraction insoluble aprSs digestion 
enzymatique des extraits bacteriens avec 50 jul de lysozyme 
(10 mg/ml) et lyse par ultrasons. 

Les proprietes antigeniques des antigenes 
recombinants pET28C-clone 2 (1077 pb) et pET2lC-clone 2 
(1077 pb) ont ete testees par Westen Blot () aprfes 
solubilisation du culot bact^rien avec 2% SDS et 50 mM p- 
mercapto^thanol. Apres incubation avec les serums de 
patients atteints de sclerose en plaques, les scrums des 
t^moins neurologiques et les serums de temoins de centre 
de transfusion sanguine (CTS) , les immunocomplexes ont 6t§ 
detect6s S l«aide d'un serum de chevre anti-IgG et anti 
IgM humaines, coupl§ a la phosphatase alcaline. 

Les rgsultats sont presentes dans le tableau ci- 

aprds . 

TABLEAU 

Reactivite de serums atteints de sclerose en plaques et 
tSmoins avec la prot6ine recombinante MSRV-i gag clone 2 
(1077 pb) = pET21C-clone 2 (1077 pb) et pET28C-clone 2 



(1077 pb) 



MALADIE 



SEP 

TEMOINS 
NEUROLOGIQUES 
TEMOINS 
SAINS (CTS) 



KOMBRE 

D'INDIVIDUS TESTfiS 
15 



NOMBRE 

D'INDIVIDtfS POSITIFS 
6 



22 



2 (+++), 2(++), 2(+) 
1 (++-»-) 

1(+/-) 



5 (a) Les bandelettes contenant 1,5 d'antigene 
recombinant pET-gag clone 2 (1077 pb) pr6sentent une 
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reactivity contre de serums dilues au i/ioo. 
L- interpretation de Western Blot est bas§e sur la presence 
ou absence d'une bande pET-gag clone 2 (1077 pb) 
specif ique sur les bandelettes. Des contrdles positifs et 
5 negatifs sont inclus dans chaque experience. 

Ces resultats montrent que, dans les conditions 
techniques utilisees, environ 40% des serums humains 
atteints de sclerose en plaques testes rSagissent avec les 
10 protgines recombinantes pET28C-clone 2 (1077 pb) et 
pET2ic-clone 2 (1077 pb). une r4activit§ a et6 observee 
sur un tfimoin neurologique et il est interessant de noter 
que les ARN extraits a partir de ce s6rum, aprds l'6tape 
de transcriptase inverse, sont aussi amplifies par PCR 
15 dans la region pol. Ceci suggSre que des personnes n'ayant 
pas declare une SEP peuvent ggalement heberger et exprimer 
ce virus. Par contre, un temoin (donneur CTS) apparemment 
sain, possede des anticorps anti-gag (clone 2, 1077 pb) . 
Ce qui est compatible avec un immunity acquise contre 
20 MSRV-l en dehors d'une maladie autoimmune associ6e 
d6c large. 



EXEMPT.R 7; OBTENTION D'UN 

UNE PARTI E HOMOLOGUE AU CLONE 
25 ET EN 5« UNE PARTIE HOMOLOGUE 
LA RflGION LTR US. 



CLONE LB13 CONTENANT EN 3« 
2 CORRESPONDANT AU GENE GAG 
AU CLONE 5M6 CORRESPONDANT A 
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Une RT-PCR (« reverse-transcriptase-polymerase 
chain reaction ") a ete effectu6e a partir de 1-arn total 
extrait de virions, provenant de surnageants de cellules 
lymphocytaires B des patients atteints de sclerose en 
plaques, concentres par ultracentrifugations. La synthese 
de cDNA a M realisee avec une amorce spfecifique SEQ N« 
XXX et la transcriptase inverse " Expand'^'' RT " de 
BOEHRINGER MANNHEIM selon les conditions preconis6ee par 
la soci^te. 
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Amorce utilisfee pour la synthdse du cDNA, identifiee par 
SEQ ID NO: 138: 

5' CTT GGA GG6 TGC ATA ACC AGG GAA T 3« 

Une amplification par PGR a et6 realisSe avec la 
5 rag polymerase (Perkin Elmer, France) sous les conditions 
suivantes: 940c 1 min, SS-C 1 min, 72-c 2 min pendant 35 
cycles et pendant 7 min et avec un volume r6actionnel 

final de lOO nl. 

Amorces utilis6es pour 1 'amplification par PGR: 

10 - amorce 5», identifiee par SEQ ID NO: 139 
5" TGT CCG CTG TGC TCC TGA TC 3« 
- amorce 3", identifiee par SEQ ID NO: 138 
5 • CTT GGA GGG TGC ATA ACC AGG GAA T 3 • 

Une deuxifeme amplification par PCR dite « semi- 

15 nichee " a et6 realisee avec une amorce 3' situ6e t 
I'interieur de la region d6jS amplififee. Cette deuxieme 
amplification a ete effectuee sous les m#mes contitlons 
expirimentales que celles utilis6es lors de la premiere 
amplification, en utilisant 10 ^1 du produit 

20 d' amplification issu de la premiere PCR. 

Amorces utilisees por 1 -amplification par PCR « semi- 
nich&e ": 

- amorce 5", identifiee par SEQ ID NO: 139 
5' TGT CCG CTG TGC TCC TGA TC 3' 
25 - amorce 3«, identififee par SEQ ID NO: 140 
5« CTA TGT CCT TTT GGA CTG TTT GGG T 3 • 

Les amorces SEQ ID NO: 138 et SEQ ID NO: 140 sent 
spicifiques de la region gag, clone 2 position 
nucl^otidique n- 373-397 et n« 433-456. Les amorces 
30 utilis6es dans la region 5- ont 6t6 definies sur des 
sequences des clones obtenus lors d'essals prealables. 

Un produit d' amplification de 764 pb a et6 obtenu 
et clone de la fa9on suivante: 

L'ADN amplifie a ete ins§r6 dans un plasmide a 
35 I'aide du kit TA CloningTM. Les 2 /.l de solution d'ADN ont 
ete melanges avec 5 Ml d'eau distillee stfirile, 1 m1 d'un 
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tampon de ligation lo fois concentre "lox LIGATION 
BUFFER", 2 Ml de ..pCR™ VECTOR" (25 ng/.l) et 1 ^1 de "T4 
DNA LIGASE". Ce melange a 6te incube une nuit t 14 "C, Las 
etapes suivantes ont ete r6alis6es conformSment au 
5 instructions du kit TA Cloning« (Invitrogen) . Le melange a 
etg 6tal6 apres transformation de la ligation dans des 
bacteries E. aoli luvaF' . a la fin de la procedure, les 
colonies blanches de bacteries recombinantes ont 6te 
repiguees pour etre cultiv6es et permettre l-extraction 
10 des plasmides incorpores selon la procedure dlte de 
"minipreparation d-ADN" (17) . La preparation de plasmide 
de chaque colonie recombinante a ete coupee par !• enzyme 
de restriction Eco RI et analysSe sur gel d-agarose, Les 
plasmides poss6dant un insert detecte sous lumifire uv 
aprfes marquage du gel au bromure d'^thidium, ont ete 
s61ectionn6s pour le sgquen^age de 1- insert, aprfes 
hybridation avec une amorce complement a ire du promoteur T7 
present sur le plasmide de clonage du TA cloning kit®. La 
reaction prealable au sequengage a ensuite 6tS effectufee 
selon la m^thode pr6conis6e pour 1 -utilisation du kit de 
s6quen9age "PRiSM™ Ready Reaction Amplitaq® fs 
Dyeoeoxy Terminator" (Applied Biosystems, ref. 402119) 
et le sSquengage automatique a 6t§ r6alis6 sur les 
appareils 373 A et 377 Applied Blosystems, selon les 
25 instructions du fabrlcant. 

Le clone LB13 obtenu contient une region N- 
terminale de gene gag MSRV-1 homologue au clone 2 et un 
LTR correspondant a une partie de la region US. Entre la 
region U5 et gag un site de fixation pour les ARN de 
30 transfert, le PBS « primer binding site " a 6t6 identififi. 

La sequence nucl^otidique du fragment de 764 pb 
du clone LB13 dans le plasmide «pCR™ vector" est 
reprSsentSe dans 1 ' identif icateur SEQ ID NO: I4i. 

Le site de fixation pour les ARN de transfert 
5 presentant une sequence du type PBS tryptophane, a 6t6 
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identifie en position nucl^otidique n»342-359 du clone 



LB13. 



Un autre clone, denomme LA15 a 6te obtenu sur 
I'ARN total extrait de virions concentres par 
ultracentrifugation a partir d'un surnageant de culture de 
synoviocytes provenant d'un patient atteint de 
polyarthrite rhumatoide. La strategie d- amplification et 
clonage du clone LA15 est exactement la inSme qui a 6t6 
utilisfee pour le clone LB13. 

La sequence nucleotidique du clone LA15 qui est 
representee dans 1 • identif icateur SEQ ID NO: 142, est tres 
similaire au clone LB13. Ceci sugggre que le retrovirus 
MSVR-l detecte dans la sclerose en plaque presente des 
sequences similaires a celles rencontrees dans la 
polyarthrite rhumatoide. 
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LISTE DE SEQUENCES 



(2) INFORMATIONS POUR LA SEQ ID NO: 68: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 34 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iin^aire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 68: 
GACTCGCTGC AGATCGATTT TTTTTTTTTT TTTT 



(2) INFORMATIONS POUR LA SEQ ID NO: 69: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 69: 
GCCATCAAGC CACCCAAGAA CTCTTAACTT 



<2) INFORMATIONS POUR LA SEQ ID NO: 70: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 
I A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 
(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 70: 
CCAATAGCCA GACCATTATA TACACTAATT 



• 
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(2) IKPORMATIONS POUR LA SEQ ID NO: 112 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR, 310 paires de baeee 

(B) TYPE! nuclfiotidique 

(C) NOMBRE DE BRIIfS: simple 

(D) CONFIGURATION: linfiaire 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 112: 

GCTTATAGAA GGACCCCTAG TATGGGOTAA TCCCCTCTGG GAAACCAAGC CCCAGTACTC 60 
AGCAGGAAAA ATAGAATAGG AAACCTCACA AGGACATACT TTCCTCCCCT CCAGATGGCT 120 
AGCCACTGAG GAAGGAAAAA TACTTTCACC TGCAGCTAAC CAACAGAAAT TACTTAAAAC 180 
CCTTCACCAA ACCTTCCACT TAGGCATTGA TAGCACCCAT CAGATGGCCA AATTATTATT 240 
TACTGGACCA GGCCTTTTCA AAACTATCAA GAAGATAGTC AGGGGCIXSTO AAGTGTGCCA 300 
AAGAAATAAT 

310 

15 (2) INFORMATIONS POUR LA SEQ ID NO: 113 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 103 acides amin6s 

(B) TYPE: peptidique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUBNCEi SEQ ID NO: 113: 

LIEGPLVWGNPLWETKPQYSAGKIEXETSQGHTFLPSRWLATEEGKILSPAANQQKLLKTLHQTF«LOID 
STSQMAKLLFT6PGLFKTIKKIVR6CEVCQRWN 

25 (2) INFORMATIONS POUR LA SEQ ID NO: 114 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 635 pairea de bases 
(B> TYPE: nucl6otidique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCEj SEQ ID NO: 114: 
CCCTGTATCT TTAACCTCCT TGTTAAGTTT GTCTCTTCCA GAATCAAAAC TGTAAAACTA 60 
CAAATTGTTC TTCAAATGGA GCACCAGATG GACTCCATGA CTAAGATCCA CCCTGCAOCC 120 
CTGCACCCCC CTOCTACCCC ATGCTCCGAT OTTAATGACA T7X;AAGGCAC CCCTCCCGAG 180 
35 GAAATCTCAA CTGCACAACC CCTACTATGC CCCAATTCAC CGGCAAGCAC TTAGAGOGGT 240 
CATCACCCAA CCTCCCCAAC AGCACTTGGG TTTTCCTGTT GAGAGGGGGG ACTGACACAC 300 
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AGGACTAGCT GGATTTCCTA GGCCAACGAA GAATCCCTAA GCCTAGCTGG GAAGGTGACT 360 
GCATCCACCT CTAAACATGG GGCTTGCAAC TTAGCTCACA CCCGACCAAT CAGAGAGCTC 420 
ACTAAAATGC TAATTAGGCA AAAATAGGAG GTAAAGAAAT AGCCAATCAT CTATTGCCTG 480 
AGAGCACAGC GGGAGGGACA AGGATCXSGGA TATAAACCCA GGCATTCGAG CCGGCAACGG 540 
5 CAACCCCCTT TGGGTCCCCT CCCTTTGTAT GGGCGCTCTG TTTTCACTCT ATTTCACTCT 600 
ATTAAATCTT GCAACTGAAA AAAAAAAAAA AAAAA 535 

(2) INFORMATIONS POUR LA SEQ ID NO: 115 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 77 acidGs amines 

(B) TYPE: peptidique 

(C) NOMBRE DE BRINS: Eimple 

(D) CONFIGURATION: lineaire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 115: 

15 PCIFNLLVKFVSSRIKTVKLQIVLQMEHQMESMTKIHRGPLDRPASPCSDVNDIEGTPPEEISTAQPLLC 
PNSA6SS 



(2) INFORMATIONS POUR LA SEQ ID NO: 116 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucl6otidique 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATIONS lin€aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 116: 
5 TOGGGTTCCA TTTGTAAGAC CATCTGTAGC TT 3- 

(2) INFORMATIONS POUR LA SEQ ID NO: 117 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1481 paires de base 
^ (B) TYPE: nucl^otidique 

(C) NOMBRE DE BRINS: simple 
(0) CONFIGURATION: lineaire 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 117: 
ATGGCCCTCC CTTATCATAC TTTTCTCTTT ACTGTTCTCT TACCCCCTTT CGCTCTCACT 60 
> GCACCCCCTC CATGCTGCTG TACAACCAGT AGCTCCCCTT ACCAAGAGTT TCTATGAAGA 120 
ACGCGGCTTC CTGGAAATAT TGATGCCCCA TCATATAGGA GTTTATCTAA GGGAAACTCC 180 
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ACCTTCACTG CCCACACCCA TATGCCCCGC AACTGCTATA ACTCTGCCAC TCTTTGCATG 240 
CATGCAAATA CTCATTATTG GACAGGGAAA ATGATTAATC CTAGTTGTCC TGGAGGACTT 300 
GGAGCCACTG TCTGTTGCAC TTACTTCACC CATACCAGTA TGTCTGATCG GGGTGGAATT 360 
CAAGGTCAGG CAAGAGAAAA ACAAGTAAAG GAAGCAATCT CCCAACTCAC COGGGGACAT 420 
AGCACCCCTA GCCCCTACAA AGGACTAGTT CTCTCAAAAC TACATGAAAC CCTCCGTACC 480 
CATACTCGCC TGGTGAGCCT ATTTAATACC ACCCTCACTC GGCTCCATGA GGTCTCAGCC 540 
CAAAACCCTA CTAACTGTTG GATGTGCCTC CCCCTGCACT TCAGGCCATA CATTTCAATC 600 
CCTGTTCCTG AACAATGGAA CAACTTCAGC ACAGAAATAA ACACCACTTC OGTTTTAGTA 660 
GGACCTCTTG TTTCCAATCT GGAAATAACC CATACCTCAA ACCTCACCTG TGTAAAATTT 720 
AGCAATACTA TAGACACAAC CAGCTCCCAA TGCATCAGGT GGGTAACACC TCCCACAOGA 780 
ATAGTCTGCC TACCCTCAGG AATATTTTTT GTCTGTGGTA CCTCAGCCTA TCATTGTTTC 840 
AATGGCTCTT CAGAATCTAT GTGCTTCCTC TCATTCTTAG TCCCCCCTAT GACCATCTAC 900 
ACTGAACAAG ATTTATACAA TCATGTCGTA CCTAAGCCCC ACAACAAAAG AGTACCCATT 960 
CTTCCTTTTG TTATCAGAGC AGGAGTGCTA GGCAGACTAG GTACTGGCAT TGGCAGTATC 1020 
ACAACCTCTA CTCAGTTCTA CTACAAACTA TCTCAAGAAA TAAATGGTGA CATGGAACAG 1080 
GTCACTGACT CCCTGCTCAC CTTGCAAGAT CAACTTAACT CCCTAGCAGC AGTAGTCCTT 1140 
CAAAATCGAA GAGCTTTAGA CTTGCTAACC GCCAAAAGAG GGGGAACCTG TTTATTTTTA 1200 
GGAGAAGAAC GCTGTTATTA TCTTAATCAA TCCAGAATTC TCACTCAGAA AGTTAAAGAA 1260 
ATTOGAGATC GAATACAATG TAGAGCAGAG GAGCTTCAAA ACACCGAACG CTGGGGCCTC 1320 
CTCAGCCAAT GGATGCCCTG GGTTCTCCCC TTCTTAGGAC CTCTAGCA6C TCTAATATOXS 1380 
TTACTOCTCT TTGGAOCCTO TATCTTTAAC CTCCTTCTTA AGTTTXJTCTC TTCCAGAATT 1440 
GAAGCTOTAA ACCTACAGAT GGTCTTACAA ATGGAACOCC A 2481 

(2) INFORMATIONS POUR LA SEQ ID NO: 118 
25 (i) CARACTERISTIQUBS DE LA SEQUENCE: 

(A) I/)NGUEUR: 493 acides ainin6e 

(B) TYPE: peptidigue 

<C) NOMBRE DE BRINS: simple 
(D) CONFIGURATIONS lin^aire 
(xi) DESCRIPTION DE LA SEfiUENCE: SEQ ID NO: 118: 

MALPYHTFLFTVLLPPFALTAPPPCCCTTSSSPyoEPLXRTRLPGNIDAPSl'RSLSKGNSTFTAHTHMPR 
NCYNSATLCMHANTHYVmiKMINPSCPGGLGATVCWTyFTHTSMSOGGGIQGQAREKQVKEAISQLTRCH 
STPSPYKGLVLSKLHETLRTHTRLVSLFNTTLTRLHEVSAQNPTNCWMCLPLHFRpyiSIPVPEQWNNFS 
TEINTTSVLVGPLVSNLEITHTSNLTCVKFSNTlDTTSSQCIRWVTPPTRIVCLPSGIFFVOCTSAyHCL 
NGSSESNCFLSFLVPPMTIYTEQDLyNHWPKPHNKRVPILPFVIRAGVLGRLGTGIGSITTSTQPyYKL 
SQEINGDMEOVTDSLVTLQDQLNSLAAWLONRRALDLLTAKRGGTCLFLGEERCYYVNQSRIVTEKVKE 
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IRDRIQClUVEELQNTERWGLLSQWMPWVLPFLGPLAALILLLLFGPCrFNLLVKFVSSRIEAVKXQM\nLQ 
MEP 



(2) INFORMATIONS POUR LA SEQ ID NO: 119 
5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de base 

(B) TYPE! nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATIONS Unfair e 

10 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 119: 

TCAAAATCGA AGAGCTTTAG ACTTGCTAAC CG 32 

(2) INFORMATIONS POUR LA SEQ ID NO: 120 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
15 (A) r/>NGUEUR: 1329 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 120: 

20 TCAAAATCGA AGAGCTTTAG ACTTGCTAAC CGCCAAAAGA GGGGGAACCT GTTTATTTTT 60 

AGGGGAAGAA TGCTGTTAGT ATGTTAATCA ATCTGGAATC ATTACTGAGA AAGTTAAAGA 120 

AATTTGAGAT OGAATATAAT GTAGAGCAGA GGACCTTCAA AACACTGCAC CCTGGGGCCT 180 

CCTCAGOCAA TGGATGCCCT GGACTCTCCC CTTCTTAGGA CCTCTAGCAG CTATAATATT 240 

TTTACTOCTC TTTGGAOCCT GTATCTTCAA CTTCCTTGTT AAGTTTGTCT CTTOCAGAAT 300 

25 TGAAGCTGTA AAGCTACAAA TACTTCTTCA AATGGAACCC CAGATGCAGT CCATGACTAA 360 

AATCTACCGT GGACCCCTGG ACCGGCCTGC TAGACTATGC TCTGATGTTA ATGACATTGA 420 

AGTCACCCCT CCCGAGGAAA TCTCAACTGC ACAACCCCTA CTACACTCCA ATTCAGTAGG 480 

AAGCAGTTAG AGCAGTTGTC AGCCAACCTC CCCAACAGTA CTTGGGTTTT CCTGTTGAGA 540 

GGGTGGACTG AGAGACAGGA CTAGCTGGAT TTCCTAGGCT GACTAAGAAT CCCNAAGCCT 600 

30 ANCTGGGAAG GTGACCGCAT CCATCTTTAA ACATGGGGCT TGCAACTTAG CTCACACCOG 660 

ACCAATCAGA GAGCTCACTA AAATGCTAAT CAGGCAAAAA CAGGAGGTAA AGCAATAGOC 720 

AATCATCTAT TGCCTGAGAG CACAGCGGGA AGGACAAGGA TTGGGATATA AACTCAGGCA 780 

TTCAAGCCAG CAACAGCAAC CCCCTTTGGG TCCCCTCCCA TTGTATGGGA GCTCTGTTTT 840 

CACTCTATTT CACTCTATTA AATCATGCAA CTGCACTCTT CTGGTCCGTG TTTTTTATGG 900 

35 CTCAAGCTGA GCTTTTGTTC GCCATCCACC ACTGCTGTTT GCCACCGTCA CAGACCCGCT 960 
GCTGACTTCC ATCCCTTTGG ATCCAGCAGA GTCTCCACTG TGCTCCTGAT CCAGCGAGGT 1020 
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ACCCATTGCC ACTCCCGATC AGGCTAAAGG CTTGCCATTG TTCCTGCATG GCTAAGTGCC 1080 
TGGGTrXGTC CTAATAGAAC TGAACACTGG TCACTGGGrT CCATGCTTCT CTTCCATGAC 1140 
CCACGGCTTC TAATAGAGCT ATAACACTCA CCGCATGGCC CAAGATTCCA TTCCTTGGTA 1200 
TCTGTGAGGC CAAGAACCCC AGGTCAGAGA ANGTGAGGCT TGCCACCATT TGGGAAGTGG 1260 
5 CCCACTGCCA TTTTGGTAGC GGCCCACCAC CATCTTGGGA GCTGTGGGAG CAAGGATCCC 1320 
CCAGTAACA ^3^^ 

(2) INFORMATIONS POUR LA SEQ ID NO: 121 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
0 (A) LONGUEUR: 162 acidee aroints 

(B) TYPE: peptide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 121: 
> QNRRALDLLTAKRGGTCLFLGEECCXYVNQSGIITEKVKEIXDRIXCRAEDLQNTAPWGLLSQWMPWTLP 

FLGPLAAIIPLLLF6PCIPNPLVKFVSSRIEAVKLQIVLQMEPQMQSMTKIYRGPLDRPARLCSDVNDIE 
VTPPEEISTAQPLLHSNS VGSS 



(2) INFORMATIONS POUR LA SEQ ID NO: 122 
20 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: pairee de baee 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
(D> CONFIGURATION! lin§aire 

!5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 122: 

GGCATTGATA GCACCCATCA G 

(2) INFORMATIONS POUR LA SEQ ID NO: 123 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
0 (A) LONGUEUR: 21 paires de base 

(B) TVPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 123: 
5 CATGTCACCA GGGTGGAATA G 



<f1 

(2) INFORMATIONS POUR LA SEQ ID NO: 124 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) COMPIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 124 



(2) INFORMATIONS POUR LA SEQ ID NO: 126 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
(D> CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 126: 
CATGTCACCA GGGTGGAATA G 

(2) INFORMATIONS POUR LA SEQ ID NO: 127 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: Simple 

(D) CONFIGURATION: linfiaire 

{xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 127: 
GGACAGGAAA GTAAGACTGA GAAGGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 128 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
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(A) LONGUEUR: paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

5 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 128: 

cf Exemple 5 

(2) INFORMATIONS POUR LA SEQ ID NO: 129 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 129: 

Cf Exemple 5 

(2) INFORMATIONS POUR LA SEQ ID NO: 130 

<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1511 paires de base 
!0 (B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION! lln^aire 

(xi) DESCRIPTION DE LA SEQUENCE* SEQ ID NO: 130: 

CCTAGAAOGT ATTCTGGAGA ATTGGGACCA ATGTGACACT CAGACGCTAA GAAAGAAAOC 60 

5 ATTTATATTC TTCTGCAGTA CCGCXTTGCCC ACAATATCCT CTTCAAGGGA OAGAAACCTO 120 

GCTTCCTGAG GGAAGTATAA ATTATAACAT CATCTTACAG CTAGACCTCT TCTGTAGAAA 180 

GGAGGGCAAA TGGAGTGAAG TGCCATATGT GCAAACTTTC TTTTCATTAA GAGACAACTC 240 

ACAATTATGT AAAAAGTGTG GTTTATGCCC TACAGGAAGC CCTCAGAGTC CACCTCCCTA 300 

CCCCAGCGTC CCCTCCCCGA CTCCTTCCTC AACTAATAAG GACCCCCCTT TAACCCAAAC 360 

0 GGTCCAAAAG GAGATAGACA AAGGGGTAAA CAATGAACCA AAGAGTGCCA ATATTCCCOG 420 
ATTATGCCCC CTCCAAGCAG TGAGAGGAGG AGAATTCGGC CCAGCCAGAG TGCCTGTACC 480 
TTTTTCTCTC TCAGACTTAA ACCAAATTAA AATAGACCTA GGTAAATTCT CAGATAACCC 540 
TGACGGCTAT ATTGATGTTT TACAAGGGTT AGGACAATCC TTTGATCTGA CATGGAGAGA 600 
TATAATGTTA CTACTAAATC AGACACTAAC CCCAAATGAG AGAAGTGCCG CTGTAACTGC 660 

1 AGCCCGACAG TTTGGCGATC TTTGGTATCT CAGTCAGGCC AACAATAGGA TGACAACAGA 720 
GGAAAGAACA ACTCCCACAG GCCAGCAGCC AGTTCCCACT GTAGACCCTC ATTGTCACAC 780 
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AGAATCAGAA CATGGAGATT GGTGCCACAA ACATTTGCTA ACTTGCCTGC TAGAAGGACT 840 
GAGGAAAACT AGGAAGAAGC CTATGAATTA CTCAATGATG TCCACTATAA CACAGGGAAA 900 
GGAAGAAAAT CTTACTGCTT TTCTGGACAG ACTAAGGGAG GCATTCAGGA AGCATACCTC 960 
CCTGTCACCT GACTCTATTG AAGGCCAACT AATCTTAAAG GATAAGTTTA TCACTCAGTC 1020 
AGCTGCAGAC ATTAGAAAAA ACTTCAAAAC TCTGCCTTAG GCCCGGAGCA GAACTTAGAA 1080 
ACCCTATTTA ACTTGGCATC CTCAGTTTTT TATAATAGAG ATCAGGAGGA GCAGGCGAAA 1140 
CGGGACAAAC GGGATAAAAA AAAAAGGGGG GGTCCACTAC TTTAGTCATG GCCCTCAGGC 1200 
AAGCAGACTT TGGAGGCTCT GCAAAAGGGA AAAGCTGGGC AAATCAAATG CCTAATAGGG 1260 
CTGGCTTCCA GTGCXSGTCTA CAAGGACACT TTAAAAAAGA TTATCCAAGT AGAAATAAOC 1320 
CGCCCCCTTG TCCATGCCCC TTACGTCAAC GGAATCACTG GAAGGCCCAC TCCCCCAGGG 1380 
GATGAAGATA CTCTGAGTCA GAAGCCATTA ACCAGATGAT CCAGCAGCAG GACTGAGGGT 1440 
GCCCGGGGCG AGCX5CCAGCC CATGCXJATCA CCCTCACAGA GCCCOGGGTA TGTTTGACCA 1500 
TTGAGAGCCA A 



1511 



15 (2) INFORMATIONS POUR LA SEQ ID NO: 131 

(i) CARACTERISTIQUES DE LA SEQUENCE i 

(A) LONGUEURS 347 acides amings 

(B) TYPE: peptide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATIONS lin§aire 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 131: 

LERILENWDQCDTQTLRKKRFIFFCSTAWPQVPLQGRETWLPEGSINYNlILQLDLPCRKEGKWSEVPyv 
QTFFSLRDNSQLCKKCGLCPTGSPQSPPPYPSVPSPTPSSTNKDPPLTQTVQKEIDKGVNMEPKSANIPR 
LCPLQAVRGGEFGPARVPVPPSLSDLKQIKIDLGKFSDNPDGyiDVLQGLOQSFDLTWRDIMLLLNQTLT 
PNERSAAVTAAREPGDLWYLSQANNRMTTEERTTPTCQQAVPSVDPHWDTESEHODWCHKHLLTCVLEGL 
RKTRKKPMNySMMSTITQGKBENLTAFLDRLREALRKHTSLSPDSIEGQLILKDKFITQSAADIRKNFKS 



25 



(2) INFORMATIONS POUR LA SEQ ID NO: 132 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 132: 
TGCTGGAATT CGGGATCCTA GAACGTATTC 
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(2) INFORMATIONS POUR LA SEQ ID NO: 133 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: cimple 

(D) CONFIGURATION: lin^aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 133: 
AGTTCTGCTC CGAAGCTTAG GCAGACTTTT 



(2) INFORMATIONS POUR LA SEQ ID NO: 135 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: acides amines 

(B) TYPE: peptide 

(C) NOMBRE DE BRINS: simple 
{D) CONFIGURATION: lin^aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 135: 

MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRILERILENWDQCDTQTLRKKRFIFFCSTAWPQYPLQGR 

ETWLPEGSINYNIILQLDLFCRKEGKWSEVPYVQTFFSLRDNSQLCKKCGLCPTGSPQSPPPypSVPSPT 

PSSTNKDPPLTQTVQKEIDKGVNNEPKSANIPRLCPLQAVRGGEFGPARVPVPPSLSDLKQIKIDLGKFS 

DNPDGYIDVLQGLGQSFDLTVmDIMLLLNQTLTPNERSAANn-AAREFGDLWyLSQANNRMTTEERT^^ 

QQAVPSVDPHWDTESEHGDWCHKHLLTC\a-EGLRKTRKKPMNYSMMSTITQGK£ENLTAFLDRLraALRK 

HTSLSPDSIEGQLILKDKFITQSAADIRKNFKSLPKLAAALEHHHHHH 
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10 (2) INFORMATIONS POUR LA SEQ ID NO: 137 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: acides amines 

(B) TYPE: peptide 

(C) NOMBRE DE BRINS: simple 
^5 (D) CONFIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 137: 

MASMTGGQQMGRILERILENWDQCDTQTLRKKRPIFFCSTAWPQYPLQGRETWLPEGSINyNIILQLDLF 

CRKEGKWSEVPyVQTFFSLRDNSQLCKKCGLCPTGSPQSPPPYPSVPSPTPSSTNKDPPLTQTVQKEIDK 

GVNNEPKSANIPRLCPLQAVRGGEFGPARVPVPPSLSDLKQIKIDLGKFSDNPDGYIDVLQGLGQSFDLT 

20 V^IMLLLNQTLTPNERSAAVTAAREFGDLWYLSQANNRMTTEERTTPTGQQAVPSVDPHWDTESEHGDW 

CHKHLLTCVLEGLRKTRKKPMNYSMMSTITQGKEENLTAFLDRLREALRKHTSLSPDSIEGQLILKDKFI 
TQS AAD I RKNFKSLPKLAAALEHHHHHH 



(2) INFORMATIONS POUR LA SEQ ID NO: 138 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 25 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATIONS lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 138: 
CTTGGAGGGT GCATAACCAG GGAAT 



(2) INFORMATIONS POUR LA SEQ ID NO: 139 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de base 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BR INS: simple 

(D) CONFIGURATION: iin^aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 139: 
TGTCCGCTGT GCTCCTGATC 2 

5 

(2) INFORMATIONS POUR LA SEQ ID NO: 140 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de base 

(B) TYPE: nucleotide 

0 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 140: 
CTATGTCCTT TTGGACTGTT TGGGT 2*= 

> (2) INFORMATIONS POUR LA SEQ ID NO: 141 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 764 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
' (D) CONFIGURATION: lin^aire 

(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 141: 

TGTCCGCTGT GCTCCTGATC CAGCACAGGC GCCCATTGCC TCTCCCAATT GGGCTAAAGG 60 

CTTGCCATTG TTOCTGCACA GCTAAGTGCC TGGGTTCATC CTAATCGAGC TGAACACTAG 120 

TCACTGGGTT OCACGGTTCT CTTCCATGAC CCATGGCTTC TAATAGAGCT ATAACACTCA 180 

CTGCATGGTC CAAGATTCCA TTCCTTGGAA TCCGTGAGAC CAAGAACCCC AGGTCAGAGA 240 

ACACAAGGCT TGCCACCATG TTGGAAGCAG CCCACCACCA TTTTGGAAGC AGCCOGCCAC 300 

TATCTTGGGA GCTCTGGGAG CAAGGACCCC AGGTAACAAT TTGGTGACCA CGAAGGGACC 360 

TGAATCOGCA ACCATGAAGG GATCTCCAAA GCAATTGGAA ATGTTCCTCC CAAGGCAAAA 420 

ATGCCCCTAA GATGTATTCT GGAGAATTCG GACCAATTTG ACCCTCAGAC A6TAAGAAAA 480 

AAATGACTTA TATTCTTCTG CAGTACCGCC CTGGCCACGA TATCCTCTTC AAGGGGGAGA 540 

AACCTGGCCT CCTGAGGGAA GTATAAATTA TAACACCATC TTACAGCTAG ACCTGTTTTG 600 

TAGAAAAGGA GGCAAATGGA GTGAAGTGCC ATATTTACAA ACTTTCTTTT CATTAAAAGA 660 

CAACTCGCAA TTATGTTAAC AGTGTGATTT GTGTTCCTAC ACGGAAGCCC TCAGATTCTA 720 

CTCCCCACCC CCGGCATCTC CCCTGAATCC CTCCCCAACT TATT 764 

(2) INFORMATIONS POUR LA SEQ ID NO: 142 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 800 paires de base 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONPIGURATION: lin6aire 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 142: 

TGTCCGCTGT GCTCCTGATC CAGCACAGGC GCOCATTGCC TCTCCCAATT GGGCTAAAGG 60 

CTTGCCATTG TTCCTGCACA GCTAAGTGCC TGGGTTCATC CTAATCGAGC TGAACACTAG 120 

TCACTGGGTT CCACGGTTCT CTTCCATGAC CCATGGCTTC TAATAGAGCT ATAACACTCA 180 

CTGCATGGTC CAAGATTCCA TTCCTTGGAA TCCGTGAGAC CAAGAACCCC AGGTCAGAGA 240 

ACACAAGGCT TGCCACCATG TTGGAAGCAG CCCACCACCA TTTTGGAAGC GGCCCGCCAC 300 

TATCTTGGGA GCTCTGGGAG CAAGGACCCC CAGGTAACAA TTTGGTGACC ACGAAGGCAC 360 

CTGAATCOGC AACCATGAAG GGATCTCCAA AGCAATTGGA AATGTTCCTC CCAAOGCAAA 420 

AATGCCCCTA AGATGTATTC TGGAGAATTG GGACCAATCT GACCCTCAGA CAGTAAGAAA 480 

AAAAATGACT TATATTCTTC TGCAGTACCG CCTGGCCACG GATATCCTCT TCAAGGGGGA 540 

GAAAOCTGGC CTCCTGAGGG AAGTATAAAT TATAACACCA TCTTACAGCT AGACCTGTTT 600 

TGTAGAAAAC CAGGCAAAT6 GAGTGAAGTG CCATArTTAC AAACTTTCTT TTCATTAAAA 660 

GACAACTOGC AATTATGTAA ACAGTGTGAT TTGTGTCCTA CAGGAAGCCC TCAGATCTAC 720 

CTCCCTACCC OGGCATCTCC CTGACTCCTT CCCCAACTAA TAAGGACCCA CTTCAGOCCA 780 
AACAGTCCAA AAGGACATAG 

oOO 
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REVENDICATIONS 



1. Materiel nucleique, a I'etat isol6 ou purifig, 
comprenant une sequence nucleotidique choisie dans le 
5 groupe qui consiste en (i) les sequences SEQ ID MO- 112 
SEQ ID no: 114, SEQ ID NO: 117, SEQ ID NO: l2o[ 

SEQ ID NO: 124, SEQ ID NO: 130, SEQ ID NO: 141 et 

SEQ ID NO: 142 ; (ii) les sequences compl^mentaires des 
sequences (i) ; et (iii) les sequences equivalentes aux 
10 sequences (i) ou (ii), en particulier les sequences 
prfesentant pour toute suite de loo monomeres contigus, au 
moins 50 %, et preferentiellement au moins 70 % 
d'homologie avec respectivement les s§quences (i) ou (ii) . 

2. Materiel nucleique, a l'6tat isol6 ou purifie, 
15 codant pour un polypeptide presentant, pour toute suite 

contigue d'au moins 30 acides amines, au moins 50 %, et de 
prfefgrence au moins 70 % d'homologie, avec une sfiquence 
peptidique choisie dans le groupe qui consiste en 
SEQ ID no: 113, SEQ ID N-115, SEQ ID NO: 118, 

20 SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

3. Materiel nucl§ique retroviral, dont le gfene pol 
coitiprend une sequence nuclSotidique identique ou 
6quivalente a une sequence choisie dans le groupe qui 
consiste en SEQ ID NO: 112, SEQ ID NO: 124 et leurs 

25 sequences conpl^nientaires. 

4. Materiel nucleique retroviral, dont I«extr6init6 
5" du gdne pol commence au nucleotide 1419 de 
SEQ ID NO: 130. 

5. Materiel nucl6ique retroviral, dont le g^ne pol 
30 code pour un polypeptide presentant, pour toute suite 

contigue d'au moins 3 0 acides amines, au moins 50 %, et de 
preference au moins 70 % d'homologie, avec la sequence 
peptidique SEQ ID NO: 113. 

6. Materiel nucleique retroviral, dont I'extremite 
3' du gene gag finit au nucleotide 1418 de SEQ ID NO: 130. 
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7. Materiel nucleique retroviral, dont le gene env 
comprend une sequence nucleotidique identique ou 
Equivalents a une s6quence choisie dans le groupe qui 
consiste en SEQ id NO: 117, et ses sequences 
compl^mentaires . 

8. Materiel nucl§ique retroviral, dont le gene env 
comprend une sequence nucleotidique qui commence au 
nucleotide l de SEQ id NO: 117 et finit au nucliotide au 
nucliotide 233 de SEQ ID NO: 114. 

9. Materiel nucleique retroviral, dont le gene env 
code pour un polypeptide prSsentant, pour toute suite 
contigue d'au moins 30 acides amines, au molns 50 % et de 
preference au moins 70 % d'homologie, avec la sequence 
SEQ ID NO: « 118. 

10. Materiel nucleique retroviral dont la region 
U3R du LTR 3- comprend une sequence nucleotidique qui se 
termine au nucleotide 617 de SEQ ID NO: 114. 

11. Materiel nucleique retroviral dont la region 
RU5 du LTR 5- comprend une sequence nucleotidique qui 
commence au nucleotide 755 de SEQ ID NO: 120 et finit au 
nucleotide 337 de SEQ ID NO: 141 ou SEQ ID NO: 142. 

12. Materiel nucleique retroviral comprenant une 
sequence qui commence au nucleotide 755 de SEQ ID NO: 120 
et qui se termine au nucleotide 617 de SEQ ID NO: 114. 

Materiel nucleique retroviral selon I'une 
quelconque des revendications precedentes, caracterise en 
ce qu'il est associe a au moins une maladie auto-immune 
telle que la sclerose en plaques ou la polyarthrite 
rhumatoXde. 

14. Fragment nucleotidique comprenant une sequence 
nucleotidique choisie dans le groupe qui consiste en (i) 
les sequences SEQ ID NO: 112, SEQ ID NO: 114 

SEQ ID NO: 117, SEQ ID NO: 120, SEQ ID NO: 124 ' 

SEQ ID NO: 130, SEQ ID NO: 141 et SEQ ID NO: 142 ; (ii)' 
les sequences complementaires des sequences (i) ; et (iii) 
les sequences equivalentes aux sequences (i) ou (ii), ©n 
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particulier les sequences presentant pour toute suite de 
100 monomeres contigus, au moins 50 % et 
preferentiellen,ent au moins 70 % d'homologie' avec 
respectivement les sequences (i) ou (ii). 
5 15. Fragment nucl6otidique selon la revendication 

14, conslstant en une sequence nucleotidique choisie dans 
le groupe qui consists en (i) les sequences 
SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 117 

SEQ ID NO: 120, SEQ ID NO: 124, SEQ ID NO: 13o' 

10 SEQ ID no: 141 et SEQ ID NO: 142 ; (ii, les sequences 
complementaires des sequences (i, ; et (iii, les sequences 
gquivalentes aux sequences (i) ou (ii) , en particulier les 
sequences presentant pour toute suite de 100 monomeres 
contigus, au moins 50 %, et pr^f^rentiellement au moins 
15 70 % d'homologie avec respectivement les sequences (i) ou 
(ii) . 

16. Fragment nucleotidique comprenant une sequence 
nucleotidique codant pour un polypeptide presentant, pour 
toute suite contigue d'au moins 30 acides amines, au moins 

20 50 %, et de preference au moins 70 % d'homologie, avec une 
sequence peptidique choisie dans le groupe qui consiste en 
SEQ ID NO: 113, SEQ ID N-115, SEQ ID NO: 118, 

SEQ ID NO: 121, SEQ ID NO: 135 et SEQ ID NO: 137. 

17. Fragment nucleotidique selon la revendication 
25 16, consistant en une sequence nucleotidique codant pour 

un polypeptide presentant, pour toute suite contigue d'au 
moins 30 acides amines, au moins 50 %, et de preference au 
moins 70 % d'homologie, avec une sequence peptidique 
choisie dans le groupe qui consiste en SEQ ID NO: 113 

30 SEQ ID N0115, SEQ ID NO: 118, SEQ ID NO: 121! 

SEQ ID NO: 135 et SEQ ID NO: 137. 

18. Sonde nucleique pour la detection d'un 
retrovirus associe a la sclerose en plaques et/ou la 
polyarthrite rhumatoide, caracterisee en ce qu'elle est 

35 susceptible de s'hybrider specif iquement sur tout fragment 
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selon I'une quelconque des revendications 14 a 11, 
appartenant au genome dudit retrovirus. 

19, Sonde selon la revendication 18, caracterisee 
en ce qu'elle possede de 10 k 100 nucleotides, de 
5 preference de 10 & 30 nucleotides. 

20- Amorce pour 1 • amplification par polymerisation 
d'un AEW ou d'un ADN d'un retrovirus assocife a la sclerose 
en plaques et/ou la polyarthrite rhumatoide, caracterisee 
en ce qu'elle comprend une sequence nucleotidique 

10 identique ou equivalente a au moins une partie de la 
sequence nucleotidique d'un fragment selon I'une 
quelconque des revendications 8 a 11, notamment une 
sequence nucleotidique presentant pour toute suite de 10 
monomeres contigus, au moins 50 %, de preference au moins 

15 70 % d'homologie avec au moins ladite partie dudit 
fragment. 

21* Amorce selon la revendication 20, caracterisee 

en ce que sa sequence nucleotidique est choisie parrai 

SEQ ID NO: 116, SEQ ID NO: 119, SEQ ID NO: 122, 

20 SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, 

SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 132, Ct 

SEQ ID NO: 133. 

2 2 . ARN ou ADN , et notamment vecteur de 

replication et/ou d' expression, comprenant un fragment 
25 genomique du materiel nucieique selon I'une quelconque des 

revendications 1 ci 7 ou un fragment selon I'une cjuelconque 

des revendications 14 a 17, 

23. Peptide code par tout cadre de lecture ouvert 

appartenant a un fragment nucleotidique selon I'une 
30 quelconque des revendications 14 a 17, notamment 

polypeptide, par exemple oligopeptide formant ou 

comprenant un determinant antigenique reconnu par des sera 

de patients infectes par le virus MSRV-1, et/ou chez 

lesquels le virus MSRV-1 a ete reactive. 
35 24. Peptide selon la revendication 23 comprenant 

une sequence identique, partiellement ou totalement, ou 
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equivalente a une sequence choisie parmi SEQ ID NO: 113, 
SEQ ID N*»115, SEQ ID NO: 118, SEQ ID NO: 121, 

SEQ ID NO: 135 et SEQ ID NO: 137. 

25, Composition diagnostique, prophylactique, ou 
5 thfirapeutique, notamment pour inhiber 1' expression d»au 
moins un retrovirus associe a la sclerose en plaques et/ou 
a la polyarthrite rhumatoide, comprenant un fragment 
nucleotidique selon I'une quelconque des revendications 14 
a 17. 

10 26. Procede pour detecter un retrovirus associS ^ 

la sclerose en plaques et/ou a la polyarthrite rhumatolde, 
dans un echantillon biologique, caract§rise en ce que l»on 
met en contact un ARN et/ou un ADN presume appartenir ou 
provenant dudit retrovirus, ou leur ARN et/ou ADN 

15 complementaire, avec une composition comprenant un 
fragment nucl§otidique selon I'une quelconque des 
revendications 14 a 17, 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

QCTEATftGAA OGACOXTAG TMQQQCICftA TOCXXTCTOG GAAACTIAAQC 50 
AYRR TPS MG. SPLG NQA 
LIE GPLV WGN PLW ETKP 
L.K DP. YGVI PSG KPS 

OCCAGEACIC AGCAGGAAAA. ATAGAATAGG AAAOCTCACA A£33ACAIftCT 100 
PVL SRKN RIG NLT RTYF 
QYS AGK lE.E TSQ GHT 
PSTQ QEK .NR KPHK DIL 

TiaTODOCT CCAGAraaCT AGCX^OGAG GAAQGA^^ 150 

PPL QMA SH.G RKN TFT 
FLPS RWL ATE EGKI LSP 
SSP PDG. PLR KEK YFHL 

TQ0P£3CmPC CAACAGAAAT TACTDAAAAC OCTICADCAA. ADCnOCACT 200 
CS.P TEI T.N PSPN LPL 
AAN QQKL LKT LHQ TFHL 
QLT NRN YLKP FTK PST 

TftGQCATIGA TAQCADGCAT CAGA3Q3C3CA. AATEATIMT TACIG3A0CA 250 
RH. .HPSDGQIIIYWTR 

GID STH QMAK LLF TOP 
.ALI API RWP NYYL LDQ 

GQOCrmCA AAACTATCAA GAAGATAGTC AGOGQCIGIG AAGIGIOXA 300 

PFQ NYQ EDSQ GL. SVP 
GLFK TIK KIV RGCE VCQ 
AFS KLSR R.S GAV KCAK 

AAGAAAIAAT 310 
K K . 
R N N 
E I 
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FIG 2 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

OOCIGIMCr TTAADCIDCT lUrmAGITr GIUKTVCCA GAATCAAAAC 50 
PCIF NLL VKF VSSR IKT 
PVS LTSL LSL SLP ESKL 
LYL .PP C.VC LFQ NQN 

TGmAAACIA C2\AM'lG'i'lC TICAAAIOGA GCAOCAGAIG GAGIDCATCA 100 
VKL QIVL QME HQM ESMT 
.NY KLF FKWS TRW SP. 
CKTT NCS SNG APDG VHD 

CmGATOCA Cn3ia3ADOC CI03AaiJ^ 150 

KIH RGP LDRP ASP CSD 
LRST VDP WTG LLAH APM 
.DP PWTP GPA C.P MLRC 

GITAATCACA. TIGfiAGQCAC CCCTCXDGAG GAAATCICAA CIQCACAAOC 200 
VNDI EOT PPE EIST AQP 
LMT LKAP LPR KSQ LHNP 
. .H .RH PSRG NLN CTT 

CCmzmrOC OOCAAnCAG C333M^3CPG TEAGAQCOCSr CATCAaC3CAA 250 
LLC PNSA GSS .SG HQPT 

YYA PIQ REAV RAV I SQ 
PTMP QFS GKQ LERS SAN 

OCTOOOCAAC AGCACrroaS TmOCIGIT GAGAQ9QQQG AC7IGAGAGAC 300 

SPT ALG FSC. EGG LRD 
PPQQ HLG FPV ERGD .ET 
LPN STWV FLL RGG TERQ 

AGGACIM3CT QGALL'i'lLL'iA GQ0CAAD3AA GAATOCXTTAA QOCTrAQCIGG 350 
RTSW IS. ANE ESLS LAG 
GLA GFPR PTK NP. A.LG 
D.L DFL GQRR IPK PSW 
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10 20 30 40 50 

1234567890 1234S67flqn l 234567fiQn i::!^4567RQn 1?^^S67RQn 
GAAGG?IGACT GCATOCAOIT CTAAACATOG GQCTroCAAC TTAGCICACA 40o" 
KVT ASTS KHG ACN LAHT 
R.LHPPLNMGLAT LT 
EGDC IHL .TW GLQL SSH 

0CXI3ACX:AAr CftGAGAGCTC a™^^ 45q 

RPIRELTKMLIRQK E 
PDQS ESS LKC .LGK NRR 
PTN QRAH .NA N.A KIGG 

GTAAAGAAAT AG03WICAT dATIGOCTS AGAQCACAQC GQGfiQQGACA 500 
^^K. PII YCL RAQR EGQ 
• RN SQSS lA. EHS GRDK 
KEI ANH LLPE STA GGT 

AQGAroaGGA -EMCftAAODCA GQCATTOGAG OCXSGGAMQG CAAOOOOCIT 550 
GSG YKPR HSS RQR QPPl 
DRD INP GIRA GNG NPL 
RIGI .TQAFE PATA TPF 

TOcsGTOcrcT ox'mumr Gcmscrcro TmcAcicr ArncAcicr eoo 

GPL PLY GRSV FTL F HS 
WVPS LCM GAL FSLY FTL 
GSP PFVW ALC F HS I SLY 

ATIAAAICIT GCAACTO^AA AAAAAAAAAA AAAAA 635 
IKSC N.K KKK K 
LNL ATEK KKK K 
•ILQLKKKKKK 
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FIG 4 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

ATOQODCia: CmTCATAC TmCIUriT ACTOTTCICr TADOOOCnr 50 
MALP YHT FLF TVLL PPF 
WPS LIIL FSL LFS YPLS 
GPP LSY FSLY CSL TPF 



axncicftcr gcmjocccvc catoctocig tacaadcagt AOCiDOOcrr loo 

ALT APPP CCC TTS SS P Y 
LSL HPL HAAV QPV APL 
RSHC TPS MLL YNQ. LPL 

AOCAAGftGIT TCIMGAAGA ADQ03QCTIC CTOGAAATAT IGMQQCDCA 150 

QEF L.R TRLP GNI DAP 
TKSF YEE RGF LEIL M PH 
PRV SMKN AAS WKY .CPI 

ICAITflmGGA Grmrcu^A GGGAAACTCr AOCTICACIG OTACftaXA 200 
SYRS LSK GNS TFTA HTH 
HIG VYLR ETP PSL PTPI 
I.E FI. GKLH LHC PHP 

IMQCXXXXSC AACIGCEATA ACICIODCAC TCTITOCMG CAIGCAAftOSV 250 
MPR NCYN SAT LCM HANT 
CPA TAI TLPL FAC MQI 
YAPQLL. LCHSLHACKY 

CICATEATIG GACAQGGAAA ATCATEAATC CTAb'i'iUiOC TOGftQGACIT 300 

HYW TGK MINP SCP GGL 
LIIGQGK .LI LVVL EDL 
SLL DREN D.S .LS WRTW 

OGAQGCACIG ICIGTIOSAC TTACITCADC GATADCACTA 'IGICIGAT3G 350 
CATV CWT YFT HTSM SDG 
EPL SVGL TSP IPV CLMG 
SHC LLD LLHP YQY V.W 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

AOCTCAOCIG ICTAAAATIT AQCAAIACIA mSACACAAC CAQCTOCCAA 750 

LTC VKF SNTI DTT SSQ 
TSPV .NL AIL .TQP APN 
PHL CKI. QYY RHN QLPM 

IGCMCAQGJT GSGfrnACAOC TOOCACAOGA AEAGflUIGOC mXXTCAGG 800 
CIRW VTP PTR IVCL PSG 
ASG G.HL PHE - SA YP QE 
HQV GNT SHTN SLP TL R 

AAfim'lTi'iT GICIGIQCJIA OCIGAGOCTA. TCAIi'iUl'i'lG AMQQCIdT 850 
IFF VCGT SAY HCL NGSS 
YFL SVV PQPI IV. MAL 
NIFC L WY LSL SLFE WLF 

CAGAATCEAT GIQCTIDCTC TCAH'iL'I'EAG TGODOCJCIAT GACCATCEAC 900 

ESM CFL SFLV PPM TIY 
QNLC ASS HS, CPL. PST 
RIY VLPL ILS APY DH LH 

ACIGAACAAG MTIAaACAA ICATOTOSm CCTAAQOOOC ACAACAAAAG 950 
TEQD LYN HVV PKPH NKR 
LNK lYTI MSY LSP TTKE 
.TR FIQ SCRT .AP QQK 

pomjccKUT CTTocrmG teatcagaqc: aqgagiqcta gqcj^gaciag looo 

VPI LPFV IRA GVL GRLG 
YPF FLL LSEQ EC. AD. 
STHS SFC YQS RSAR QTR 

GTACTOQCAT TOQCAGEATC ACAADCTCIA CICAGI'iCiA CIACAAACm 1050 

TGI GSI TTST QFY YKL 
VLAL AVS QPL LSST TNY 
YWH WQYH NLY SVL LQTI 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

TCICAAGAAA TAAMGGIGA. CATOGAACAG GICACIGACT COCTOGnCAC 1100 
SQEI NGD MEQ VTDS LVT 
LKK .MVT WNR SLT PWSP 
SRN KW. HGTG H.L PGH 
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CnOCAAGAT CAACriAACT OCTTAGCAGC AGJEAGflOCIT CAAAAICGAA 1150 
LQD QLNS LAA VVL QNRR 
CKI NLT P.QQ -SF KIE 
LARS T.L PSS SSPS KSK 

GAGCmaGA CnOCIAAOC GOGftAAAGAG 03C3GAACCIG TTIMnnA 1200 

ALD LLT AKRG GTC LFL 
EL.T C.P PKE GEPV YF. 
SFR LANR QKR GNL FIFR 

GGAGAAGAAC GCIGTIMTA IGITAATCAA TOZAGAATIG ICACIXS^SAA 1250 
GEER CYY VNQ SRIV TEK 
EKN AVIM LIN PEL SLRK 
RRT LLL C.SI QNC H.E 

AGTIAAAGAA AITOGAGATC GAATACAA3G 1W3AQCAGAG GAQCTICAAA 1300 
VKE IRDR IQC RAE ELQN 
LKK FEI EYNV EQR SFK 
S.RN SRS NTM .SRG ASK 

ACAOOGAAOG CraQQQCX:TC CICAGCCAAT QGATOOOCIG GGTICIOOCX: 1350 

TER WGL LSQW MPW VLP 
TPNA GAS SAN GCPG FSP 
HRT LGPP QPM DAL GSPL 

TTCTEAGGAC CIUI3^GGW3C TdAATATIG TEACICCICT TTOGAOOCIG 1400 
FLGP LAA LIL LLLF GPC 
S.D L.QL .YC YSS LDPV 
LRT SSS SNIV TPL WTL 
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10 20 30 40 50 
1234567890 1234567890 1234567890 1234567890 1234567890 

TkTcmmz crccrrcrm AGirrcfiuic ttgcagaatt gaagcictaa 1450 

IFN LLVK FVS SRI EAVK 
SLT SLL SLSL PEL KL. 
YL.P PC. VCL FQN. SCK 

AQCIACAGftT GGflCTCftCAA MQGAADOOC A 1481 

LQM VLQ MEP 
SYRW SYK WNP 
ATD GLTN GTP 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

TCAAAAIOSA ASAQCTTEAG ACTIQCTi^AC CGCCAAAAGA QQOaGAACUr 50 
SKSK SFR LAN RQKR GNL 
QNR RALD LLT AKR GGTC 
KIE EL. TC.P PKE GEP 

G'i'i'iM'i'i'l'i' AOGQGAAGAA TOCIGmCfT A3GmA3CA ATCIQGAMC 100 
FIF RGRM LLV C.S I WNH 
LFL GEE CC.Y VNQ SGI 
VYF. GKN AVS MLIN L ES 

AmCTCAGA AAGITAAAGA AmTCAGftT 03A^^ 150 

Y.E S.R NLRS NIM .SR 
ITEK VKE I.D RI.C RAE 
L L R K L K K FEI EYN VEQR 

QGADCnCAA AACACIGCAC CXnOOOGOCT OCICAQOCAA TOSftlGOOCT 200 
GPSK HCT LGP PQPM DAL 
DLQ NTAP WGL LSQ WMPW 
TFK TLH PGAS SAN GCP 

QGACICIOOC CTIUim3GA CCTCTR^^ 250 
DSP LLRT SSS YNI FTPL 
TLP FLG PLAA IIF LLL 
GLSP S.D L.Q L.YF YSS 

TrroGAOOCT GIATCITCAA CriDCTIGIT AAGITIGIUr CTIOCAGAAT 300 

WTL YLQ LPC. VOL FQN 
FGPC IFN FLV KFVS SRI 
LDP VSST SLL SLS LPEL 

TGAAGCIGIA AAGCHJACAAA TAGTICnCA AATOGAADOC CAGATOCAGT 350 
. SCK ATN SSS NGTP DAV 
EAV KLQI VLQ MEP QMQS 
KL. SYK .FFK WNP RCS 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

QCAOXSACmA AATCTACOGfT QGAOCOCTOG ADGGOaCIGC mSACEATOC 400 
HD. NLPW TPG PAC .TML 
MT K lYR GPLD RPA RLC 
P.LK STV DPW TGL L DYA 

TXnGfmjSlA NTGKSmGA J^Gia^ 450 

.C. .H. SHPSRGNLNC 
SDVN DIE VTP PEEI STA 
LML MTLK SPL PRK SQLH 

ACAAGOOCTA CTftCACIOCA ATICAGIAGG AAQCAGmG AQCAGTIGIC 500 
TTPT TLQ FSR KQLE Q LS 
QPL LHSN SVG SS. SSCQ 
NPY YTP IQ.E AVR AVV 

AGOCAAOCIC OOCAACfiCSIA CnQOSmT OCIGTIGAGA GOGflQGACTIG 550 
ANL PNST WVF LLR GWTE 
PTS PTV LGFS C.E GGL 
SQPP QQY LGF PVER VD. 

AGAGACftGSA CEAQCIG3AT Tian?^^ 600 

RQD .LD FLG. LRI PKP 
RDRT SWI S.A D.ES XSL 
ETG LAGF PRL TKN PXAX 

ANCIQGGAAG GIGADCX3CAT OCATCmAA ACATGaOGCT TXAACTTAG 650 
XWEG DRI HL. TWGL QLS 
XGK VTAS IFK HGA CNLA 
LGR .PH PSLN MGL AT. 

CICACADCX3G ACCAA1CAGA GAGCTCACIA AAAT3CTAAT CAGGCAAAAA 700 
SHP TNQR AH. NAN QAKT 
HTR PIR ELTK MLI RQK 
LTPD QSE SSL KC.S GKN 
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10 20 30 40 50 

1234567890 1234567flQ0 1 234567890 1234567R9n i::!-^456789Q 
CAQGAGGIAA AQCAAaj\QOC AAICATCEAT TOGCTCAGAG CACAGQQQGA 750 

GGK AIA NHLL PES TAG 
QEVK Q.P IIY CLRA QRE 
RR. SNSQ SSI A.E HSGK 



AGGACAAG3A TTOGGAEAaA AACICAOQGA TICAAGOCAG CAACAQCAAC 800 
RTRI GI. TQA FKPA TAT 
GQG LGYK LRH SSQ QQQP 
DKD WDI NSGI QAS NSN 

oeoCTnocsG tjoocidgca TrorAiogGA G C ' iuiurriT cactc'im'it 850 

PFG SPPI VWE LCF HSIS 
PLG PLP LYGS SVF TLF 
PLWV PSH CMG ALFS LYF 

CACIUEATIA AATCAIQCAA CTOCACICIT CIOGICOGTC TTnTUaOG 900 

LY. IMQ LHSS GPC FLW 
HSIK SCN CTL LVRV FYG 
TLL NHAT ALF WSV FFMA 

CICAAQCIGA QCmTCnC QCX3aa3^ ACTOCIGITT OXAOCGICA 950 
LKLS FCS PST TAVC HRH 
SS. AFVR HPP LLF ATVT 
QAE LLF AIHH CCL PPS 

CAGACOOaCT OCTOACTIDC ATOOCTnGG ATOCAGCAGA GIGICCACIG lOOO 
RPA ADFH PFG SSR VSTV 
DPL LTS IPLD PAE CPL 
QTRC .LPSLWIQQSVHC 

TOCTXTGAT (TAQCXSAQGr AOXATIGOC ACIDOOGATC AGQCTAAAGG 1050 

LLI QRG THCH SRS G.R 
CS.S SEV PIA TPDQ AKG 
APD PARY PLP LPI RLKA 
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10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

CrraoCATTG TiraOCAIG QCE^AGIQCC TOCSGfTITCIC CTAAIAGAAC 1100 
LAIV PAW LSA WVCP NRT 
LPL FLHG .VP GFV LIEL 
CHC SCM AKCL GL S . .N 

TCAACACIQG TCACIGOSIT OCATOGTIUr CITOCAaGAC (XADQQCTIC 1150 
EHW SLGS MVL FHD PRLL 
NTG HWV PWFS SMT HGF 
.TLV TGF HGS LP.P TAS 

TAAiaGAGCT ATAACAOItA 003CAIQ3CC CAAGATiaCA TTOCnOSm 1200 

lEL .HS PHGP RFH SLV 
. .SY NTH RMA QDSI PWY 
NRA ITLT AWP KIP F LGI 

TCIGIGAQQC CAAGAACrXX: AQGflCAGflGA ANGIGAGaCT IGOCSmOT 1250 
SVRP R. TP GQR X.GL PPF 
L.G QEPQ VRE XEA CHHL 
CEA KNP RSEX VRL ATI 

IQQGAAGIQG OXACIQCJCA 'I'lTlUGEAQC O3CCCM30PC CATCITOQGA 1300 
GKW PTAI LVA AHH HLGS 
GSG PLP FW.R PTT ILG 
WEVA HCH FGS GPPP SWE 

GCTCIGGGAG CAAGGATOOC: CC?Gim::A 1329 

CGS KDP PVT 
AVGA RIP Q. 
LWE QGSP SN 
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FIG 6 



10 20 30 40 50 

1234567890 1234567890 1234 567890 1234567890 1234567890 

CCTAGAACCrr ATTCTOOVy^ ATTGOC^^VXA ATGflGACACT CfiGAa3CTAA 50 
PRTY SGE LGP M.HS DAK 
LER ILEN WDQ CDT QTLR 
.NV FWR IGTN VTL RR. 

GAA^GAAADG ATXTATAnC TTUIQCAGTA CDSOCTQGOC PCANTATCCr 100 
KET lYIL LQY RLA TISS 
KKR FIF FCST AWP QYP 
ERND LYS SAV PPGH NIL 

CTTCAAQGGA GfiGAAAOClG OOITOCriGfiG GGAAGTMAA ATEATAACM* 150 

SRE RNL AS.G KYK L,H 
LQGR ETW LPE GSIN YNI 
FKGEKPGFLREV. IITS 

CAlCmCfiG CTWoftOCTCT TCTCEAGAAA GGAOOQCAAA TOG?GTOAAG 200 
HLTA RPL L-K GGQM E.S 
ILQ LDLF CRK EGK WSEV 
SYS .TS SVER RAN GVK 

TaCCMATCT OCMiPCTTK: TTTTCATEAA G?CACAftCIC ICMOTKCGT 250 
A IC ANFL FIK RQL TIM. 
PYV QTF FSLR DNS QLC 
CHMC KLS FH. ETTH NYV 

AAAAAGIGIG GVnMK3CCC TACMGAMC <XTCM»£?IC aVOCTOOCXA 300 

KVW FMP YRKP SES TSL 
KKCG LCP TGS PQSP PPY 
KSV VYAL QEA LRV HLPT 

CXDOCftQOSIC QCCiaXJOGA CTOCTTCriC P^KHMOMG GAOOCXXXTT 350 
PQRP LPD SFL N. .G PPF 
PSV PSPT PSS TNK DPPL 
PAS PPR LLPQ lilR TPL 

TAMOCW^ QSICCAAAftS <3^CSKEP£XPi AAOQQGflMA CAftlGftMCA 400 
NPN GPKG DRQ RGK Q.TK 

TQT VQK EIDK GVN NEP 
.PKR SKR R,T KG.T MNQ 

AMfiGTOOCA AIMTODDOG MTRTOODQC CIDCAAGCBG TGfiGftOGPOS 450 

ECQ YSP IMPP PSS ERR 
KSAN IPR LCP LQAV RGG 
RVP IFPD YAP SKQ .EEE 

AGwvrrooac ccAQoc?GfiG TOCXTCrrfioc rrmcicic TCMPcrmA 500 

RIRP SQS ACT FFSL RLK 
EFG PARV PVP FSL SDLK 
NSA QPE CLYL FLS QT. 
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10 20 30 40 50 

1234S6789Q 1234567890 1234567890 1234567890 1234567890 
NJCMPiTVPJK AATAGAOCTA GGrTAAATTCT CAGATAADOC TCftCQQCTAT 550 
AN. NRPR .IL R.P .RLY 
QIK IDL GKFS DNP DGY 
SKLK .T. VMS QITL TAI 



ATIGATCTTT TACAAOOGIT AQGACAATO: TTKMCIGA CATOGftGAGA 600 

.CF TRV RTIL .SD MER 
IDVL QGL GQS FDLT WRD 
LMF YKG. DNP LI. HGE I 

TATAATCTTA CTACrAAATC AGACACTAAC CCCAAATCAG AGAAGIQCXDG 650 
YNVT TKS DTN PK,E KCR 
IML LLNQ TLT PNE RSAA 
-CY Y.I RH.P OMR EVP 

CICTAACIQC AGOCXI^fiGAG TnOOOGATC TnOGTAICT CfiGICfiOCSOC 700 
CNC SPRV WRS LVS QSGQ 
VTA ARE FGDL WYL SQA 
L.LQ PES LAI FGIS,VRP 

AACAATAOGA TCACAfiCAGA GGAAAG^ 750 

Q.D DNR GKNN SHR PAG 
NNRM TTE ERT TPTG QQA 
TIG - QQR KEQ LPQ ASRQ 

PGTICCCfGr ai3^C^^^ 800 
SSQC RPS LGH RIRT WRL 
VPS VDPH WDT ESE HGDW 
FPV .TL IGTQ NQN MEI 

OffVQCn^CPA ACATITOCm ACriUJGriGC TAGA?^3GACT G?VC3GAAAACT 850 
VPQ TFAN LRA RRT EEN. 
CHKHLLTCVLEGLRKT 
GATN IC. LAC .KD. GKL 

AOGAAGAAQC CIA3nCMITA 900 

EEA YEL LNDV HYN TGK 
RKKP MNY SMM STIT QGK 
GRS L.IT Q.C PL. HRER 

GGAAGAAAAT CTIJOGCTr TICTOGfi^ 950 
GRKS YCF SGQ TKGG lEE 
EEN LTAF LDR LRE ALRK 
KKI LLLFWTD .GRH.G 



AOCATAOCTC OCTGnC?^XT GACICTATIG AAGC30CAACT AATCTTAAftS 1000 
AYLPVT. LY. RPTNLKG 
HTS LSP DSIE GQL ILK 
SIPP CHL TLL KAN. S.R 
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CATP>PGrTVh TCPCVCPGVC ATTAGAAAAA PCWCPMPG 1050 

.VY HSV SCRH .KK LQK 
DKFI TQS AAD IRKN FKS 
ISL SLSO LQT LEK TSKV 



TUIQCCTTA3 QO003GfGZA GAACITAGAA ADDCTATTIA ACITOOCATC 1100 
SALG PEQ NLE TLFN LAS 
LP. ARSR T.K PYL TWHP 
CLR PGA ELRN PI. LGI 

CTCAGrrmr TATAAIASftG ATCAOGMGA QCAGaOGAAA 09GGACAAAC 1150 
SVF YNRD QEE QAK RDKR 
QFF IIE IRRS RRN GTN 
LSFL . ,R SGG AGET GQT 

QQGATAAAAA AAAAMG99G GGriOCACTAC TTTPGICMG QOOCTCMQC 1200 

DKK KRG GPLL .SW PSG 
GIKK KGG VHY FSHG PQA 
G.K KKGG STT LVM ALRQ 

AAGCAGACIT TO3A0GCICT GCAAAMQGA AAAQCTO9C3C AAATCAAATO 1250 
KQTL EAL QKG KAGQ IKC 
SRL WRLC KRE KLG KSNA 
ADF GGS AKGK SWA NQM 

OCnAATAGGG CTOCSCITOCA GI003C?ICrA CMGGACACr TEAAAAAAGA 1300 
LIG LASS AVY KDT LKKI 
. .G WLP VRST RTL .KR 
PNRA GFQ CGL QGHF KKD 

TIMOCAAGT AGAAATAMC aaOOOOCTIG TCCKTQCOOC TEAOOTCA?G 1350 

IQV EIS RPLV HAP YVK 
LSK. K.A APL SMPL TSR 
YPS RNKP PPC POP LRQG 

GGAA3CACIG GAAGQCXXM: V30CCCPC3(3G GASGAAGATA CIXJIGPOTCA 1400 
GITG RPT APG DEDT LSQ 
ESL EGPL PQG MKI L.VR 
NHW KAH CPRG .RY SES 

gaaqccatia aocagaigat ocaocaocag gacigaoqgft qoc3a3c33qog 1450 
kpl tr.s ssr teg ARGE 

SH. PDD PAAG LRV PGA 
EAIN QMI QQQ D.GC PGR 

/G03CCAG0C CATOCCATCA COdCACAGA GCtCCOXTTA TOTITGACCA 1500 

RQP MPS PS'QS PGY V.P 
SASP CHH PHR APGM FDH 
APA HAIT LTE PRV CLTI 



^ 2765588 

16/27 
FIG 6 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 1234567890 

TIGAGPGCCA A 1511 
L R A 
. E P 
ESQ 



_ '2765588 

17/27 
FIO 7 



10 20 30 40 50 
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ATOCSaCAGCA GCTAICATCA TCATCATCAC AGCAGCXaOO: TOGIGCXISCG 50 
MGSS HHH HHH SSGL VPR 

OQGCAQOGAT AT3C3CraGCA TGftCIGGIGG ACAQCAAAIG GGnaaGAIOC 100 
GSH MASM TOG QQM GRIL 

TAGAA0GT2AT TCTQGAGAAT TQC3GADCAAT GJXXPCVCA GADQCIAAGA 150 
ERI LEN WDQC DTQ TLR 

AAGAAACGOT TDffiATICIT CIGCT^GTiarc GOCTQQCXaC AAJMOCTCT 200 
KKRF IFF CST AWPQ YPL 

TCAAQQG^GA GAAAOCIGQC TXOCTGMQG AW^EATAAAT TAIAACATCA 250 
QGR ETWL PEG SIN YNII 

ICTrAC?«n' AGAiXICITC TOTAGAAAGG AQ09CAAAT3 GftGIGAPGIG 300 
LQL DLF CRKE GKW SEV 

(XMMGTQC AAACmCIT TICATIAAGA GACAACICAC AATEftTCEAA 350 
PYVQ TFF SLR DNSQ LCK 

AA?^:?ICIQGT TIM^^ 400 
KCG LCPT GSP QSP PPYP 

oc?m3iar CTOooos^ 450 

SVP SPT PSST NKD PPL 

A00CAAAC9S TOCAAAMGA GAraS^^ 500 
TQTV QKE IDK GVNN EPK 

GAGIQOCAAT ATIOOOOGKr TAIGOXDCT OCAflOCfiGTC AGAQGnOGAG 550 
SAN IPRL CPL QAV RGGE 

AATTOQaOCr AGCX50^GIG OCTOIAa:iT TTICTCICIC AGACTEAAAG 600 
FGP ARV PVPF SLS DLK 

C3AAATIAAAA T?GAOCTMG lA^^ 650 
QIKI DLG KFS DNPD GYI 

TCATGTITIA CAAQCSGTEAG GACAATCCTT TCATCTCACA TOGAGAGATA 700 
DVL QGLG QSF DLT WRDI 

TAATCTTACr ACEAAAIGAG ACACTAACOC CAAASGAGAG AAGIGOCISCr 750 
MLL LNQ TLTP NER SAA 

GTAACTOCSG am^SAGIT TQOCISATCrT TOGIMCrCA GrcA0aC3CAA 800 
VTAA REF GDL WYLS QAN 
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CAflTftGSASG ACAACAGfiQG AAAGAACAflC TCXXftCfiGQC CAOCAGOCAG 850 
NRM TTEE R TT PTG QQAV 

TiarMTCT AOmnCflT IQCXSACAC^ 900 
PSV DPH WDTE SEH G D W 

TOCJCnCAAfiC ATITOCTAAC TiGGGIULIA GAAGGACKSA. OSAAAACTAG 950 
CHKH LLT CVL EGLR KTR 

GAMAMCCT MGAKmO" CAAIGATCTC CRCIMS^ACA CAGGGAAAGS 1000 
KKP MNYS MMS TIT Q GKE 

AAGAAAATCT TflCIGCnTT CIGGACAGAC TAA33GfiG9C ASTCflGGAAG 1050 
ENL TAP LDRL REA LRK 

am£JCICCC TCaCftCCIGA CICTKriGAA QQQCAACTAA TCTTAAK3GA 1100 
HTSL SPD SIE GQLI LKD 

TMCrrnaX2 ACTCAGICRG CIQCBGfiCKP THGAAAAAAC TICAAAAGIC 1150 
KFI TQSA ADI RKN FKSL 

TOCCmCCT T3a3QOOXA CIOSAGCACC AOCAOCACCA OCACIGftGAT 1200 
PKL AAA LEHH HHH H.D 
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COXCIQCm ACAAAQCaXS AAAQGAAQCT GRUi'lULUiN GIQGCNA 
PAAN KAR KEA ELAX G 
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AT3aCTftGCA TCACTOGTIGG ACAGGAAATC OKTCXaGAIOC TRGAAC33IAT 50 
MASM TGG QQM GRIL ERI 

TCTOGAGAAT TOGGACXaAT GIGACACICA GAIXCTAAGA. AAGAAAD3AT 100 
LEN WDQC DTQ TLR KKRF 

TTMATICrr Cnm^GTEACC GCX:iQQCX3a: AATAICCTCT TCAAQQGAGA 150 
IFF CST AWPQ YPL QGR 

GAAAOCIGGC TTCCIGAOQG A^^CTATAAAT TAfTAACATCA TCTEACAGCT 200 
ETWL PEG SIN YNII LQL 

AGAOCICnC ToTEAGAAAGG AQ3QCAAAIG GAGIGA?^3IG CCASATGIOC 250 
DLF CRKE GKW SEV PYVQ 

AAACTTICTT TICATIAAGA GACAACICAC AATIMG?I!AA AAAGlGlQGfT 300 
TFF SLR DNSQ LCK KCG 

TEASGOCXnA CAGGAAGOOC TCMSAGTOCA C3CTOXICADC GCAOCX5IC3CC 350 
LCPT GSP QSP PPYP SVP 

CTCm3SACT (XTIOCTCAA CEAA'mAQGA OdXHTrnA AOXAAADQG 400 
SPT P S ST NKD PPL TQTV 

TOCAAAAOGA GAm]?0^ QGGGIAAA^ 450 
QKE IDK GVNN EPK SAN 

ATiaXXXar TATOC3GCXCT 500 
IPRL CPL QAV RGGE FGP 

AGOCAGAGIG OCIGEADCIT TTTCICICIC AGACTEAAAG CAAATEAAAA 550 
ARV PVPF SLS DLK QIKI 

mSNXrCXSG TAAATICICA GASAftXCIG A03QC:iA3CA!r TCAIGnriA 600 
DLG KFS DNPD GYI DVL 

CAAGOCJITAG GACAATCCTT TCATCIGACA T9Sft3AGATA TAAIGnTACT 650 
QGLG QSF DLT WRDI MLL 

/OAAATCAG ACACTAADOC CAAA1GAGAG AAGIGOCXaCT GIAACIOCAG 700 
LNQ TLTP NER SAA VTAA 

0G0S^:5AGIT TOC30GATCIT TSGrEATCICA GICMQOCAA CAAEAQGAT3 750 
REF GDL WYLS QAN NRM 

ACAACAGAOG AAAGAACAAC lOXAC^^ 800 
TTEE RTT PTG QQAV PSV 
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MSADCOCAT T33GflCACAG AATCflGAflCA TO3?^3KnQ3 TGQCBCAAAC 850 
DPH WDTE SEH GDW CHKH 

MTIQCTAflC TIQCX3IQCTA GAAQGACTGA OSAAAflCITC GAAGAMCTT 900 
LLT CVL EGLR KTR KKP 

ATGAAJITflCr CAATCATCTC CflCERIRftCA CflGGGftAflGG AflGAAAfllCT 950 
MNYS MMS TIT QGKE ENL 

TACIQCnrr CIOGfiCflGAC TAfiGCaSflOQC AnGflQG?«G CATADCroOC 1000 
TAF LDRL REA LRK HTSL 

TGICADCTCA CICTfiTlGAA QQDCAACERA ICTERAflOGA TAAGPITMC 1050 
SPD SIE GQLI LKD KFI 

ACTCfiGTCRG CTQCSYSflCAT 'raGAAAAAflC TICAAAAGIC TCDCTD^flQCT 1100 
TQSA ADI RKN FKSL PKL 

T3CX330CXXA CICGflGGAO: AOCTOa^^ 1150 
AAA LEHH HHH H.D PAAN 



ACAAAQCXDOG AAAQGA«3Cr GfiGn03CTG GIQQCA 
KAR KEA ELAG G 
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TOIODQCTOr GCTOHGATC CftQC^^ 50 
CPLC S.S STG AHCL SQL 
VRC APDP AQA PIA SPNW 
SAV LLI QHRR PL P LPI 

QQQCIAAAGG CTIGOCATIG TTOCTGCACA GCmflGIGOC TOOSTICATC 100 
G.R LAIV PAQ LSA WVHP 
AKGLPLFLHS .VPGFI 
GLKA CHC SCT AKCL GSS 

CEAMCGAQC 1GAM3CT^ TCaCIGQGIT OCACOGTICr CTIOCMGAC 150 

NRA EH. SLGS TVL FHD 
LIEL NTS HWV PRFS SMT 
.SS .TLV TGF HGS LP.P 

(XAIQQCnC lAMAGAGCT AIAACACTCA CIQCATQGIC CAAGATIOCA 200 
PWLL lEL .HS LHGP RFH 
HGF . .SY NTH CMV QDSI 
MAS NRA ITLT AWS KIP 

TICCTIGGAA TCCXJIGRGftC CAftGAADOOC AQCITCflGAGA ACACAftGQCT 250 
SLE SVRP RTP GQR TQGL 
PWN P.D QEPQ VRE HKA 
FLGI RET KNP RSEN TRL 

TSCCACTAIG TTOGAAQCfiG Q0CAiXACX3^ TITIGGAflQC AGCOCX3QCAC 300 

PPC WKQ PTTI LEA ARH 
CHHV GSS PPP FWKQ PAT 
ATM LEAA HHH FGS SPPL 

TMCriGQGA GCIUIQQGAG CAftGGAOOCC AGGflAACAAT TIQGIGADCA 350 
YLGS SGS KDP R.QF GDH 
ILG ALGA RTP GNN LVTT 
SWE LWE QGPQ VTI W.P 

GGAAGQGAOC TGAATCOQCA AOCaTOAAGG GATCIOCAAA QCAAnOGAA 400 
EGT .IRN HEG ISK AIGN 
KGP ESA TMKG SPK QLE 
RRDL NPQ P.R DLQS NWK 
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FIG 9 (suite) 



10 20 30 40 50 

i9-^zmfi7«Qn l2^^^A7fiQn 12345 ^7ftqn m^^Gim 1234567890 
MGITCCIO: CAAGQCAAAA AIGODCTTftA GMGEftTICr C3GAGAATIGG 

VPP KAK MPLR CIL ENW 
MFLP RQK CP. DVFW RIG 
CSS QGKN APK MYS GELG 

G?CCAATITC ADOCICAGAC AGQ^AGft^ 

DQFD PQT VRK K.LI FFC 
TNL TLRQ .EK NDL YSSA 
PI. PSD SKKK MTY ILL 

CAGIftCGQQC CTOOaCAQGA TATOCICTIC AAQGOOSftGA AACCIGGCCT 
STA LATI SSS RGR NLAS 
VPP WPR YPLQ GGE TWP 
QYRP GHD ILF KGEK PGL 

CCiGAQQGAA GTATAAATIA TAACADCATC TEACAGCEAG AOCIGimG 

GK YKL .HHL TAR PVL 
PEGS INY NTI LQLD LFC 
LRE V.II TPS YS. TCFV 

qaGAAAAQGA GQGAAAIGG?V GIGAftGIGOC iffiATITACAA Aui iUV-iri r 

KRR QME .SA IFTN FLF 
"rKG GKWS EVP YLQ TFFS 
EKE ANG VKCH lYK LSF 

CATIAAAAGA CAACIDQCAA TEArom^ ACSIGIGMTT GIGITOCEAC 
IKR QLAI MLT V.F VFLH 
LKD NSQ LC.Q CDL CSY 
H.KT TRN YVN SVIC VPT 

ACGGAAGQCC TCAGfiTICIA CTOOOCftDOC OOQGCATCIC OOCIGAATOC 

GSP QIL LPTP GIS PES 
TEAL RFY SPP PASP LNP 
RKP SDST PHP RHL P. IP 



crooocAAcr tait 

L P N L 
S P T Y 
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FIG 10 



10 20 30 40 50 
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TCIOOQCIGT QCTOC?IGAIC 50 
CPLC S.S STG AHCL SQL 
VRC APDP AQA PIA SPNW 
SAV LLI QHRR PLP LPI 

QQGCIAAAGS CnOQCmG TnCTQCACA GCEAAGIQQC TOQGTICArC 100 
G.R LAIV PAQ LSA WVHP 
AKGLPLFLHS .VPGFI 
GLKA CHC SCT AKCL GSS 

css^Fmjci^ tXjM^cpcj^ i^o 

NRA E H. SLGS TVL FHD 
LIEL NTS HWV PRFS SMT 
.SS ,TLV TGF HGS LP.P 

(XATOQCnC 'E^AimGAQCT Aa?^ftC20CA CIGCMQGflC CmSkTTCCA 200 
PWLL lEL .HS LHGP RFH 
HGF . .SY NTH CMV QDSI 
MAS NRA ITLT AWS KIP 

TTOCnOGAA TOGGflGftGftC CAftGAAOOOC AGGICAGAGA ACfiCAAOaCT 250 
SLE SVRP RTP GQR TQGL 
PWN P.D QEPQ VR E HKA 
FLGI RET KNP RSEN TRL 

TOOCAIXATC TIGGAAGCfiG CCTAOCADCA TinGGAAQC G3CCCGCCM2 300 

PPC WKQ PTTI LEA ARH 
CHHV GSS PPP FWKR PAT 
ATM LEAA HHH FGS GPPL 

TAICnGQGA GCTCIQQGfiG CAAQGAOOOC CAQGIAAC?^ TTIGGIGADC 350 
YLGS SGS KDP QVTI W.P 
ILG ALGA RTP R.Q FGDH 
SWE LWE QGPP GNN LVT 

PCGM€GGM: CTGAATOOQC AADCAT3AAG QGAICTOCAA PGCPATIOGA 400 
RRD LNPQ P.R DLQ S N W K 
EGT .IR NHEG ISK AIG 
TKGP ESA TMK GSPK QLE 
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AATOITCCIC CCAAQQCAAA MTOQCTCIA AGATCIMTC IQGAGAATIG 450 

CSS QGK NAPK MYS GEL 
NVPP KAK MPL RCIL ENW 
MFL PRQK CP. DVF WRIG 

GGADCAATCr GAOCTTCAG?^ CAGfEAAGAAA AAAAMGACT TATATXCTIC 500 
GPI. PSDSKKKNDLYSS 
DQS DPQT VRK KMT Y ILL 
TNL TLR Q.EK K.L IFF 

TQCAGIA0CX3 OCIQQC3Cfi03 GMMOCICT TCAAGGQQGA GAAACCIQQC 550 
AVP PGHG YPL QGG ETWP 
QYR LAT DILF KGE KPG 
CSTA WPR ISS SRGR NLA 

CiaTTGAGSG AAGnM?Wff TAB^ACACGA 600 

PEG SIN YNTI LQL DLF 

LLRE V.I ITP SYS. TCF 

S.G KYKL .HH LTA RPVL 

TGB^GAAAAG GftGQGAAATC GfiGTEGAflGIG OCAimTmC AAAL'iTiCi'l' 650 
CRKG GKW SEV PYLQ TFF 
VEK EANG VKC HIY KLSF 
.KR RQM E.SA IFT NFL 

TTCATEftAAA GACAACTOQC AMTAIGIAA ACAGflGIGAT TIGIGIDCIA 700 
SLK DNSQ LCK QCD LCPT 
H.K TTR NYVN SVI CVL 
FIKR QLA IM. TV-F VSY 

CAQGAAGCO: TCAGfiOTTAC CTOOCEADOC OQaCAIUIDC CIGACICCIT 750 

GSPQIYL PTPASP .LL 
QEAL RST SLP RHLP.DSF 
RKP SDLP PYP GIS LTPS 

OOOCAACIAA lAAQGADOCA CTICAGOOCA AACfiGflCCAA AAGGACATAG 800 
PQLI RTH FSP NSPK GH 
PN. .GPTSAQTVQKDI 
PTN KDP LQPK QSK RT. 
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10 20 30 40 50 

1234567890 1234567890 1234567890 3234567890 1234567890 

GQCATK3MA GCAOXMCA. GKD3QQCAAA TCAimTm. CTOGftOCAGG 50 
GIDS THQ MAK SLFT GPG 
ALT APIR WPN HYL LDQA 
H. . HPS DGQI IIY WTR 

QCmrCAAA ACTATCAAGC AGATRGOOOC CX?IGAAQCAT QOCAAAGAAA 100 
LFK TIKQ IGP VKH AKEI 
FS K LSS R.GP .SM PKK 
PFQN YQA DRA REAC QRN 

TAAiGCCCiG cmma3cr ATCITOCTIC AQGAGAACAA AGAACAQQQC 150 

IPC LIA MFLQ ENK EQA 
.SPA LSP CSF RRTK NRP 
NFL PYRH VPS GEQ RTGH 

ATraOOCAGG QGAAGACIQG CAACEAGATT TEACOCACAT QOGCAAATOr 200 
ITQG KTG N.I LPTW PNV 
LPR GRLA TRF YPH GQMS 
YPG EDW QLDF THM AKC 

CAQOGATnC AGCATCEACT AGIdGOaCA GA!I?OnCA CJIGGnOOGr 250 
RDF SIY. SGQ ILS LVGW 
GIS AST SLGR YFH WLG 
QGFQ HLL VWA DTFT GWV 

QGAGICnCr OCTIGEAGGA CAGAAAAGAC OCAAGAQGIA ATAAAGQCAC 300 

S L L L V GQKRPKR. .RH 
GVFS L.D RKD PRGN KGT 
ESS PCRT EKT QEV IKAL 

•I3^AJIGAAAaA ATKX3CAGAT TIQGACriOC OXftGGAirm CAGQGIGACA 350 
.NN SQI WTS PRIT G.Q 
NEI IPRF GLP PGL QGDN 
MK. FPD LDFP QDY RVT 
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FIG 11 (suite) 



10 20 30 40 50 

1234567890 1234567890 1234567890 1234567890 123456789Q 

ATOQCOXJQC TTICAAGQCT GC?GmPCCC M33C?Gnm: QCAQGIGTIA 400 
WPR FQGC SNP GSI PGVR 
GPA FKA AVTQ GVS QVL 
MAPL SRL Q.P REYP RC. 



GQCATACAAT ATCACITACA CIGIOnGG AGQOCACAAT QCTCCAGAAA 450 

HTI SLT LCLE ATI LQK 
GIQY HLH CAW RPQS SRK 
AYN ITYT VPG GHN PPEK 

AGICAAGAAA A!IGAATCAAA CACIOW^ T:^^ 500 
SQEN E.N TQR SKKA NPR 
VKK MNET LKD LKK LTQE 
SRK .MK HSKI .KS .PK 

AAAOOOCAT 1GCAIGADCT Gi'lL'iUi'lQC CTMAAOCTT ACTftflGAftIC 550 
NPH CMTC SVA YNL TKNP 
THI A.P VLLP ITL LRI 
KPTL HDL FCC L.PY .ES 

CM5^ACI3^ ODCXSWW^ CfiGG?OTM GOG 

.LS PKK QDLA HTR CYM 
HNYP PKS RT. PIRD AIW 
ITI PQKA GLS PYE MLYG 

GATOQCCirr OriAAOCAAr GftOrnGIGC 650 
DGLS .PM TLC LTEK WPT 
MAP PNQ. PCA .LR NGQL 
WPF LTN DLVL D.E MAN 

TTAGnOCAG ACA3CACCIC CTmOQCAAA TMCAACAAG TICTIAAAAC 700 
.LQTSPP .PNINKFLKH 
SCR HHL LSQI STS S.N 
LVAD ITS LAK YQQV LKT 
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FIG 11 (suite) 
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ATCACAGQGA. ADCIGrOQCC GAGfiOGAOaS AAAGGAACIA TTOCAOOCIG 750 

HRE PVP ERRE RNY STL 
ITGN LSP RGG KGTI PPW 
SQG TCPR EEG K E L F H P G 

GIGACAIG 758 
V T 

. H 

D M 
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